デスクトップPCでもHadoopを動かすことができるソフトウェア「Datameer」
Kleiner PerkinsやRedpointなどの大手インベスターから資金提供を受け、2009年にカリフォルニアのサンマテオに設立されたベンチャー企業DatameerはHadoopのエコシステム技術を得意としています。同社がリリースするのはデスクトップPCでもHadoopを動かすことができるソフトウェア「Datameer」。最新バージョンは2.0です。
Datameerの特徴は「データ統合、分析、可視化」の3ステップを1つのプラットフォームで提供できるというもの。他社のHadoop関連製品はこの3つを別々の環境で実行する必要があるのに対して、Datameerはシングルアプリケーション、ワンストップで実現すると謳っています。
Hadoopというと、安め、もとい、コモデティなIntel x86マシンをずらりと並べ、大規模分散環境の名の下、テラバイト級のデータをうんしょうんしょと処理しているイメージがありますが、Datameerが提供するPersonal版のソフトを使えばデスクトップPCでネイティブにHadoopが動き、データ分析ができるとのこと。インタフェースもHTML5ベースで、TwitterやFacebookといったソーシャルメディアをデータソースにすることができます。ただし無料ではなく(試用版あり)、シングルユーザ(ワンデスクトップ)環境で年500Gバイトまでのデータ量で299ドル、これを高いと見るか安いと見るかは、データ分析の重要度がビジネスに占める割合で変わってくるのでしょう。
Datameerは50ユーザ/1TバイトまでのServer版、ユーザ数もデータ量も無制限のEnterprise版も用意されています。Apache Hadoopだけでなく、ClouderaやHortonworks、MapRにも対応。これからの成長に注目したいベンチャーです。
現在知っておくべきOSSのビッグデータ技術、9つ
ビッグデータを支える技術は多くがオープンソース発です。現在知っておくべきOSSのビッグデータ技術を9つ紹介しているのがこちらの記事になります。
Hadoop、R言語、Cascading、Scribe、ElasticSearch、HBase、Cassandra、MongoDB、CouchDBといったところ。皆さん全部ご存知でしたでしょうか? 筆者はElasticSearchは初耳でした……。全体的にHadoopとNoSQLが中心となっているのは、まあ妥当なところかなあという気がします。個人的には今後見逃せないのはScribeのようなFacebook発のOSS技術。Scribe以外にもインメモリデータストア技術Scubaや膨大な量のC++ライブラリFollyなど、数多くのOSSプロダクトを世に公開しています。世界で最も大量のデータをリアルタイムで扱っている企業のノウハウは、これからもビッグデータの世界に大きく影響を与えそうです。
『ビッグデータの衝撃 - 巨大なデータが戦略を決める』
ビッグデータやデータベースの情報に限らず、IT系のニュースや資料を探すときはどうしてもWeb、それも最近はソーシャルメディアが中心になりがちですが、まとまった知識を体系的に得る手段としては、やはり今も昔も書籍が強いと個人的には思います。
情報の鮮度という面ではどうしてもネットに譲ってしまいますが、逆に言えば、今のような時代だからこそ、IT系の書籍は時代性を色濃く反映したもの、著者の思いを強く投影したもののほうが面白い。その面白さはネットで書き散らされる雑文(←自戒)とはレベルが大きく異なります。
というわけで、読者の期待を裏切らなさそうな6/29発売予定のビッグデータ本を一冊ご紹介します。
『ビッグデータの衝撃 - 巨大なデータが戦略を決める』(城田真琴 著/東洋経済新報社)、2012年のビッグデータ事情をさまざまな角度から分析した312ページ(←編集さんに超同情…)の大作です。定価も1,890円と良心的な設定で、2012年のビッグデータ事情を網羅したい方にはお勧めです。著者の城田真琴氏は野村総合研究所 上席研究員としてクラウドコンピューティングやビッグデータに関する講演や寄稿も多く、この分野では国内を代表するアナリスト。2012年というビッグデータが黎明期から流行期へと向かおうとしている現在にあって、我々はこの技術をどう捉えていけばよいのか、本書が示唆してくれる考え方はきっと大きいはずです。