はじめに
DBonlineなのにデータベースではなくて、あえてデータストアなんて言い方をしています。大きく多量のデータを貯めて効率的に使うという点で見るとMySQLやOracle、SQL Serverのようないかにもなデータベースが必ずしも最適ではないこともあります。データの大きさや複雑さにより、リレーショナルデータベースが生かせる場所、NoSQL・KeyValueStoreが生かせる場所というのがそれぞれにあります。
いわゆるデータベースだけではなく、「データを貯めやすく、そしてそのデータを使いやすい」ということに目を向けていくと、最適な「データストア」がなんなのかがわかってくるはずです。
ビッグデータって
今回は第1回ということで、まずは入れ物ではなくて、データストアに入る中身、「ビッグデータ」について話していきたいと思います。「ビッグデータ」という単語、最近ちらほら聞くようになってきましたけど、ビッグデータってそもそもなんなのかよくわかりませんよね。ビッグデータの定義はきっちり決まっているのかも怪しいところで、「既存の技術では管理できないほどにボリュームが増え、複雑化したデータ」と定義する人もいます 。
確かにでっかくて複雑なデータはビッグデータという感じがします。一方、私の考えるビッグデータの定義は今あるデータが複雑だろうが、ボリュームがペタバイトクラスだろうが、キロバイトクラスであろうが関係なく、「単純なバッチ処理では追いつかないような速度で増え続けるデータ」だと思っています。処理の速度には複雑さも関係してきますが、「ものすごい速さでどんどん増えていくデータ」、それも処理する速度よりも速い速度で増えていくデータをビックデータと呼ぶことにしています。ということで、これから増え続けるデータをどう扱っていこうというテーマで話を進めていきましょう。