ペタバイトクラスのデータウェアハウスをクラウドで、Redshiftの登場は衝撃的だった
「これまで何ヶ月もかけて構築していたようなものが、ほんの数分で立ち上げられます」
Amazon Web Services(AWS)でAmazon Redshiftのシニア・プロダクトマネージャを務めるRahul Pathak氏は、Redshiftならば拡張性の高いパワフルなデータウェアハウスを、すぐに始められると言う。さらに、そのデータウェアハウスは、特殊なものではなくデータベースエンジニアが慣れ親しんだSQL互換性のあるものだ。
ビッグデータ時代になり、極めて大規模なデータを活用したいというニーズがある。しかし、従来のリレーショナルデータベースでは、すべてのデータを扱うことが性能的にもコスト的にも難しい場合もある。仕方がなくApache HiveのようなNoSQLの技術を使ってなんとかデータを捨てずに活用しようとしてきた。それがRedshiftを使えば、データを捨てることなく蓄積でき、なおかつそれをSQLで活用できる。
このサービスが2013年2月に発表された際に、もっとも衝撃的だったのはその価格だろう。大規模データウェアハウスと言えば、サーバーやストレージなどのハードウェア、データベースなどのソフトウェアライセンス費用だけでも、軽く数1,000万円規模となるのは当たり前のシステム。ベンダーにとっては、稼ぎ頭のシステムだ。それが年間1000ドルから使えて、なおかつその管理はすべてAWSがやってくれるのだ。
「パッチの適用などの運用管理は、すべてAWS側で行います。顧客はデータウェアハウスの運用に手間をかける必要がなく、ビジネスに注力できます」(Pathak氏)
この仕組み、もちろんAmazon.com自体でも使っているし、ナスダックでも不正検知で利用している。さらには、foursquareやセールスフォース・ドットコムのDesk.comなど、最近勢いのある企業もいち早く採用している。日本でも良品計画がBIツールのるTableauと組み合わせて活用、名刺管理サービスを提供していSanSanでも採用し劇的にコスト削減できたそうだ。