Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

ビッグデータ活用の“前処理”データインテグレーションとブレンディングとは?

2017/04/06 06:00

 ビッグデータとアナリティクスは、AIや機械学習ブームの追い風もありIT業界で注目が続いている。特に今後は非構造化データをいかに効率良く扱うか、そして既存の構造化データを分析する仕組みとどう連携させビジネス現場で活かすかが鍵となる。そんな中、ビッグデータやアナリティクスを自社のソリューションの中心に掲げるベンダーは多いが、それをオープンソースソフトウェアで担おうと言う企業は少ない。

データのインテグレーションとブレンディングにフォーカス

 非構造化データを蓄積するデータレイク部分にオープンソースのHadoopやSparkを利用するベンダーはたくさんいる。一方でBI、アナリティクスのツールをオープンソースで提供するベンダーはまれだ。この領域で果敢にチャレンジしているのが、Pentahoだ。Pentaho自身はビッグデータとBI、アナリティクスの企業であり、特にビッグデータのインテグレーションに強味がある会社だ。

 「とりわけ、さまざまなデータソースを正確に統合化するところに焦点を置いており、これができてはじめて、ビッグデータ、アナリティクスの領域で大きな成功を収めることができます」と語るのは、Pentaho EVP兼ジャパン・ゼネラル・マネージャーのエディ・ホワイト氏だ。

 エディ・ホワイト氏

Pentahoジャパンの面々。
左から、エディ・ホワイト氏/ソリューション マーケティング&マネジメント シニア・ディレクター・チャック・ヤーボロー氏/ジャパン・マーケティング シニアディレクター 湯本敏久氏/ジャパン・マーケティング 宮本菜美氏

 Pentahoという名前が日本で取りあげられるようになったのは、2015年2月に日立により買収されたことがきっかけだろう。これは正確には日立製作所が買収ではなく、米国日立データシステムズが買収したもの。現在Pentahoは、日立グループの1企業という位置づけとなっている。結果、Pentahoの製品を日立がOEMとして扱っており、日立の中では、IoTやアナリティクスのソリューションでPentahoは中心的な製品の1つとなっている。つまり買収によりPentahoというビッグデータ、アナリティクスの製品ポートフォリオが日立に増えたわけではない。Pentahoの企業オペレーションはいまだ独立しており、グループ会社として日立と強力なパートナーシップを結ぶ形となっている。

 「日立グループの1つとなっても、社内プロセスに大きな変化はありません。一方で投資が増えたので、製品ロードマップが今までよりも速く進むようになりました。また以前は小さな会社でビジネス上苦労することも多々ありました。たとえば、大手企業のCIOなどになかなか会うことができないなどです。それが今は変わり、世界でも優秀なCIOにすぐに会えるようになりました。特に日本でこの点は、大きく変化しています」(ホワイト氏)

 Pentaho製品の特長は、「モダン・データアーキテクチャ」にある。これは構造化、非構造化データを分析したいとの市場要求に応えるためのもの。IoTのセンサーデータなど、さまざまなデータソースから非構造化データを集めデータレイクのHadoopなどに蓄積する。その仕組みと企業にすでに構築されている構造化データ分析用のデータウェアハウスなどとの間に入り「コミュニケーションを取れるようにするのがモダン・データアーキテクチャです」とホワイト氏は説明する。これにより分析作業を集中化でき、さらにはセルフサービスでビジネスアナリストなどが分析できるツールも提供する。

 「データを統合してブレンドし、豊かなものに変えていきます。それがセルフサービスで実現でき、テーラーメイドの形で多くのユーザーが利用できるようにしています」(ホワイト氏)

 データをクレンジング、変換して分析できるよう「きれい」にする。さらにオーケストレーションや仮想化の技術できれいになったデータを「ブレンディング」する。ブレンディングされたデータに対し、さまざまなアナリティクスを簡単実行できるようにする。この一連の処理をPentahoでは「データパイプライン」と表現しており、この流れを自動化し管理できるようにするのが「Pentaho Business Analytics Platform」だ。Pentaho Business Analytics Platformにはセキュリティコンポーネントも含まれており、適切な人が適切なデータにアクセスできるようセキュアにコントロールする機能もある。

 「Pentaho自体にはデータベースの機能はありませんが、Hadoopとは緊密な関係を築いています。競合との違いは単にHadoopにアクセスできるようにするだけでなく、データを視覚化し変換も行いすぐに分析ができるようにするまで実現しているところです」(ホワイト氏)

 リレーショナルデータベースからHadoopに、あるいは逆にHadoopからリレーショナルデータベースへと接続する機能はいまやどのベンダーも当たり前のように提供している。「Pentahoはそういった機能とは違い、両者のデータを適切に変換しブレンディングできます。その上でデータフローのオーケストレーションもできるのです」と強味を強調する。

 このようにデータの変換やクレンジングなどのETL機能、それによるデータインテグレーションに注力していることもあり、市場で競合する機会が多いのはインフォマティカだ。とは言え、データインテグレーションやETL市場で先行するインフォマティカと競争し勝利することを目指しているわけではない。あくまでもPentahoはビッグデータ、アナリティクスの領域で顧客に成功してもらうための製品であり、そこではすでに6年の歴史と実績があるのだ。

※この続きは、会員の方のみお読みいただけます(登録無料)。


著者プロフィール

  • 谷川 耕一(タニカワ コウイチ)

    EnterpriseZine/DB Online チーフキュレーター ブレインハーツ取締役。AI、エキスパートシステムが流行っていたころに開発エンジニアに、その後雑誌の編集者を経て、外資系ソフトウェアベンダの製品マーケティング、広告、広報などを経験。現在は、オープンシステム開発を主なターゲットにし...

バックナンバー

連載:週刊DBオンライン 谷川耕一

もっと読む

この記事もオススメ

All contents copyright © 2006-2017 Shoeisha Co., Ltd. All rights reserved. ver.1.5