Firehoseは、公開されているすべてのツイートデータ(今回の契約では、日本語のツイートデータおよび日本国内で書き込まれたすべてのツイートデータ)をリアルタイムに取得できるAPI、またはそのAPIにアクセスできる権利だという。
今回の契約締結を受けて、NTTデータでは、公開APIよりも大量・高精度・高付加価値なツイートデータを提供可能なサービスプラットフォームを開発するという。さらに、ソーシャルメディア関連のツールやサービスを提供している企業へこのプラットフォームからツイートデータを提供するとともに、企業のソーシャルメディアやビッグデータの活用を積極的に支援していくとしている。
NTTデータは、これまで、自然言語処理エンジン「なずき」を用いて、Twitterやブログ等のソーシャルメディアを活用するためのサービスやコンサルティング、テキストデータと数値データの双方を含むビッグデータの活用に取り組んできたという。それを通して、国内のユーザー企業では、これまでの公開APIでは得ることが難しかった広範囲・高精度なツイートデータの分析を求めるニーズが高まっていることを認識したという。
そうしたニーズに応えるために、米Twitter社と「データ再販(Data Resellers)」に関する契約を締結し、米Twitter社が提供するAPI「Firehose」を通じて取得・蓄積した、日本語のツイートデータおよび日本国内で書き込まれたすべてのツイートデータを提供できる権利を取得することにしたという。
今回、開発されるというプラットフォームでは、ツイートデータの全量、サンプル、任意のキーワード等で抽出されたツイートデータを、API経由またはGUIで、リアルタイムに提供することに加え、過去データについても提供するという。
さらに、プラットフォーム上で提供されるサービスでは、NTTの研究所である、ソフトウェアイノベーションセンタとプリファードインフラストラクチャーが共同開発した大量データのリアルタイム分析を可能とする「Jubatus」を採用し、各ツイートデータに独自の情報種別のタグ付けを行うという。これにより、特定のブランド、商品、出来事等に関連するツイートデータを、より広範囲・高精度で抽出・分析することが可能となり、ユーザー企業が期待するさまざまな分析ニーズに的確に応えられるようになるとしている。
NTTデータでは、このサービスを「マーケティング・プロモーションの高度化」「製品評価・故障監視」「風評監視」「顧客対応力の強化」等の幅広い分野で活用されることを想定しており、製造業、小売業、通信・放送、金融、官公庁等のさまざまな業種・業界で利用可能だとしている。
なお、NTTデータはサービスの提供開始を2012年12月初旬からとしており、11月初旬にサービス内容の詳細について発表を行う予定だという。
■ニュースリリース
http://www.nttdata.com/jp/ja/news/release/2012/092700.html