ホートンワークスの製品は、2種類に大別される。ひとつは、「流れてくる」データを処理する「HDF(Hortonworks Data Flow)」、もうひとつは、「蓄積された」データの分散処理DBであるHadoopを核にした「HDP(Hortonworks Data Platform)」。この日は、HDFの新バージョン「3.0」の内容紹介がおこなわれた。
フォレスター調査でデータウェアハウスのリーダーに
初めにマーケティング・ディレクターの北瀬公彦氏が、米国フォレスター社の調査で、ホートンワークスがAWSやSAP、IBMなどと並んで、ビッグデータウェアハウスのリーダーに選ばれていることを紹介した。これはオープンソースベースでの活動や、エコシステムによる連携、オンプレミスとクラウドの両面対応、分散ストレージ、分散処理技術、データ収集、ガバナンス、サポートなどが評価されたのだという。
そして、米国本社のインダストリーソリューションズ バイスプレジデントのエリック・トーセン氏が流通・小売とコンシューマー市場に対する、ホートンワークスの市場戦略を紹介した。
トーセン氏によると、これまでベビーブーマーを主要顧客にしてきた米国の小売業界はが大きな転換を迫られており、「テクノロジーと共に育ったミレニアル世代」にターゲットをシフトしていると語る。そうした新しい世代の顧客の価値観やふるまいを理解することが最重要だという。
トーセン氏が強調するのは、アマゾンの例だ。先頃、米国のホールフーズの大型買収が話題になったように、アマゾンの“Everything Sore”という戦略はすべての小売業界に影響を与えている。店舗で商品を見て購入はネットでおこなうなどの“ショールーミング”、サプライチェーンの最適化による配送の迅速化など、米国の流通・小売業界は現在、すべてがアマゾンの影響を受けざるを得ない。
こうした動向の中で、小売業界の取るべき戦略行動を、成熟段階から捉える図をトーセン氏は紹介した。
上図では、横軸の成熟段階は、認知、探索、最適化、変革と向かい、縦方向にロジスティクス、IT運用、マーチャンダイジング、店舗運営、デジタル、マーケティングとすると、この両軸を包括する曲線状に、各種の打ち手がプロットされる。
さらにトーセン氏は、小売業のデータの利用も、段階的なジャーニーマップとして紹介した。初期は比較的分かりやすく成果の出やすい「Webのログ解析」から出発し、顧客を個別に把握するシングルビュー、レコメンド、価格の最適化、最終的には財務情報につなげるといった、一貫した成長戦略としてとらえる見方を示した。
そしてコンシューマー市場の成功事例としてペプシコでおこなった「CPFR」の例をあげた。CPFRとは製造業と小売業が協力して計画、予測、補充といったプロセスを統合的に行うことだ。ホートンワークスは、ペプシコのCPFRプロジェクトにおいて、様々なデータを集め統合し、1日30時間かかっていたデータ処理を数分間に短縮したと語った。
ストリーミングデータアプリ構築を支援するSAM
続いて、ホートンワークスのエンジニアの河村康爾氏が「HDF3.0」を紹介した。河村氏「Apache NiFi PMC」の肩書を持つ。オープンソースの管理をする財団であるApacheにおいて、ホートンワークスは120名におよぶコミッタ(主要開発者)を持つ。これは世界最大規模でIBMとほぼ同数となる。PMCはApacheの中でも、プロジェクトのガバナンスやブランディングまで見る上位の職位であり、日本では稀少な存在になるという。
この日発表された、HDF3.0は3つの構成要素を持つ。1)Appache NiFiによるデータフローをGUIで管理できる機能、2)ストリーミングデータ分析、3)企業向けにデータを管理する機能郡だ。
中でも、HDF3.0で追加された新機能は、以下となる。
●Streaming Analytics Manager(SAM)
コードを記述することなくストリーミングアプリケーションを構築できる。ドラッグアンドドロップ形式のインターフェイスをによってストリーミングアプリケーションの設計、開発、テスト、配備、維持をが可能となる。
●スキーマレジストリ
スキーマ用の新しい共有リポジトリを利用することで、Apache Kafka、Apache
Storm、Apache NiFiなどの複数のストリーミングエンジンにまたがってアプリケー
ションを柔軟に相互動作させることができ、エンドツーエンドのデータガバナンスとオペレーション効率の向上が出来る。
「これまでエンジニアにとって敷居が高かったストリーミングデータ分析のアプリケーションを構築が、SAMによって容易になった」と河村氏は語り、NiFiとOSSの「Kafka」によって、車載データなどの各種データを収集し、スキーマを一元管理するというデモを行った。
最後に、日本法人社長の廣川裕司氏は、「OSSによる貢献が評価され、IBMはパートナーにより、Hadoop関連をすべてホートンワークスに任せている。これまでのデータウェアハウスのような構造化データではなく、これからは新しい多種多様なデータの時代であり、そのために必要になるのがデータレイクだ。この分野でホートンワークスはNo.1となる」と語った。