EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

第4回 高速処理にはデータベース!

edited by DB Online   2011/08/22 07:00

さて、Excel でのデータ分析やShare Point での共有を見てきましたが、もっと大量のデータを扱う必要がある場合を考えてみましょう。

Excelの限界を超える大量データの場合

 さて、Excelでのデータ分析やShare Pointでの共有を見てきましたが、もっと大量のデータを扱う必要がある場合を考えてみましょう。

  たとえば、企業での商品の売上や生産の分析をしたい場合、その分析対象のデータは膨大になり、Excel2010で扱える行数1,048,576行を超えてしまうかもしれません。そうなるとExcelにデータを入れておくわけにはいかなくなります。たとえばある企業で1日100件ほどの受注があり、それぞれ平均50明細持っているという受注パターンの場合、Excelだと1日で5,000行分になりますね。これが1か月20営業日だとして月に100,000行、1年では1,200,000行ですから、あっという間にExcelの限界を超えてしまいます。パフォーマンス的にも、Excelでは厳しい面が出てきます。

 そうした場合、データの管理にデータベース(Database Management System, DBもしくはDBMSと略したりもします)を使うことになります。データベースは文字通り、データを格納し管理するシステムです。データベースというと一部の人だけが使うシステムのように聞こえるかもしれませんが、実は私達の生活でも様々な場面で毎日利用しているものなのです。

 たとえば、電車や地下鉄に乗る際に利用する非接触型ICカード。首都圏ではSuicaやPasmoなどがありますが、そのカードを使って改札を通過する際のデータは、データベースで管理されています。スーパーマーケットやコンビニエンスストアでも、お客様によって何が買われたかはPOSデータとしてデータベースに格納されます。銀行の口座情報も全て、データベースで管理されています。私達の生活の至るところに、データベースを使ったシステムはたくさん存在していて、重要なデータとして管理されているのです。

 そして、このようにデータベースに格納されているデータも、もちろんExcelを使って分析することができますし、さらにもっと高度な多次元分析、というようなこともできるのですが、多次元分析については別の回で詳しく紹介したいと思います。

 では、Excelに保存されているデータをデータベースに格納したいと思ったとき、どのようにすればよいでしょうか。

 実はデータベースと一口に言っても、様々な種類があり、商用のものから無償のものまで、様々なベンダーから提供されています。ここでは、そのうちの1つとしてマイクロソフトのSQL Serverを取り上げます。

 SQL Serverについては他の連載でも詳しくお伝えしていますので、是非参考にしてください。

・あたらしいSQL Server/Denaliの世界
・正しく使えば速くなる!多田が教えるSQL Server最適化のオキテ


著者プロフィール

  • 松澤純(マツザワジュン)

    マイクロソフト株式会社 サーバープラットフォームビジネス本部 プロダクト マネージャー 大学時代は情報工学とも理系とも全く縁のない分野を専攻し、新卒で某 DB ベンダーに就職。ERP 製品の新機能検証、研修インストラクターを経て、GIS ソリューション ベンダーに約1年出向、お客様何でも窓口兼プロジェクト マネージメントを経験。帰社後は製品リリース マネージャーとして製品を構成する各種コンポーネントの日本でのリリース管理を担当。転職後、2009年より SQL Server の Product Manager として主にブロードな製品啓蒙活動に携わる。  

バックナンバー

連載:文系のためのBI入門
All contents copyright © 2007-2020 Shoeisha Co., Ltd. All rights reserved. ver.1.5