Excelの限界を超える大量データの場合
さて、Excelでのデータ分析やShare Pointでの共有を見てきましたが、もっと大量のデータを扱う必要がある場合を考えてみましょう。
たとえば、企業での商品の売上や生産の分析をしたい場合、その分析対象のデータは膨大になり、Excel2010で扱える行数1,048,576行を超えてしまうかもしれません。そうなるとExcelにデータを入れておくわけにはいかなくなります。たとえばある企業で1日100件ほどの受注があり、それぞれ平均50明細持っているという受注パターンの場合、Excelだと1日で5,000行分になりますね。これが1か月20営業日だとして月に100,000行、1年では1,200,000行ですから、あっという間にExcelの限界を超えてしまいます。パフォーマンス的にも、Excelでは厳しい面が出てきます。
そうした場合、データの管理にデータベース(Database Management System, DBもしくはDBMSと略したりもします)を使うことになります。データベースは文字通り、データを格納し管理するシステムです。データベースというと一部の人だけが使うシステムのように聞こえるかもしれませんが、実は私達の生活でも様々な場面で毎日利用しているものなのです。
たとえば、電車や地下鉄に乗る際に利用する非接触型ICカード。首都圏ではSuicaやPasmoなどがありますが、そのカードを使って改札を通過する際のデータは、データベースで管理されています。スーパーマーケットやコンビニエンスストアでも、お客様によって何が買われたかはPOSデータとしてデータベースに格納されます。銀行の口座情報も全て、データベースで管理されています。私達の生活の至るところに、データベースを使ったシステムはたくさん存在していて、重要なデータとして管理されているのです。
そして、このようにデータベースに格納されているデータも、もちろんExcelを使って分析することができますし、さらにもっと高度な多次元分析、というようなこともできるのですが、多次元分析については別の回で詳しく紹介したいと思います。
では、Excelに保存されているデータをデータベースに格納したいと思ったとき、どのようにすればよいでしょうか。
実はデータベースと一口に言っても、様々な種類があり、商用のものから無償のものまで、様々なベンダーから提供されています。ここでは、そのうちの1つとしてマイクロソフトのSQL Serverを取り上げます。
SQL Serverについては他の連載でも詳しくお伝えしていますので、是非参考にしてください。
・あたらしいSQL Server/Denaliの世界
・正しく使えば速くなる!多田が教えるSQL Server最適化のオキテ