データを物理的な制約から解放せよ
データウェアハウスでデータから現状を紐解き、ビジネスを見える化する。次のステップでデータに高度なアナリティクスやAIの技術を適用し、新たな洞察を導き出す―企業データ活用、デジタル変革に抱いているイメージはこんな感じではないだろうか。これに対し、「セカンドステップに行くのにも、そのためのデータがないという顧客が多い」と指摘するのは、日本IBMのアナリティクス事業説明会に登壇した取締役専務執行役員 IBMクラウド事業本部長の三澤智光氏だ。
IBM独自の調査によると、すぐにAIに利用できたのは企業全体が持っているデータの30%以下だった。企業は多くのデータを抱えているが、そのほとんどが「AI Ready」ではない。そういう現状がある中で、企業は顧客の360度ビューを実現しようとし、さらにAIで何らか新しい知見を得てビジネスを変革しようとしている。この「現実」と「やりたいこと」のギャップを埋めるには、データプラットフォームをしっかりと作っていく必要がある。
IBMではAI Readyを実現するために「集める、繋げる、データにアクセス」「データの検索」「分析のためのデータの理解、準備」「データの定義と規定、予測モデルの作成」「モデルの管理と配備」「AIへのデータ活用アプリケーションの作成」という、6つのプロセスを定義している。これら6つのプロセスに対応する製品をIBMでは既に提供しており、中にはオープンソースソフトウェアもある。それら全体で、AI Readyの基盤となるデータプラットフォームを提供する。ここでまず重要となるのが、データを収集するところだ。
「IBM Db2に全てのデータがあるわけではありません。非構造化データもあり、それらはさまざまなデータファイルのシステムに格納されています。リレーショナルデータベースにも、さまざまなものがあります。データプラットフォームは、それらAny Dataに対応できなければならないのです」(三澤氏)
その上でデータを整理し、さまざまなツールで分析できるようにする。さらに必要なデータがあれば加え、最終的にAIのアプリケーションなりで活用する。このAIについても、Watsonが全てではない。Any AIであり、場合によっては他のDeep Learningの仕組みなどが適していることもある。
このAny DataをAny AIにつなぐには、データをきちんと整備する必要がある。そのためにIBMが提供するのが「Enterprise Catalog」だ。
「これはAny Dataを機械学習などの技術を使い上手く分類し、カタログデータを作ります。これによりデータのメタデータも合わせてカタログ管理できるようにするものです。これを使えばさまざまな人が、さまざまなツールを使ってアナリティクスを行い、さらにそのデータをAny AIで活用できます」(三澤氏)
Enterprise Catalogでは、企業が抱えるさまざまなデータのメタデータ管理の仕組みを提供する。さらに、AIなどで扱おうとしているデータがどのようにして作られたかも管理できる。その上でデータを利用する人が、分かりやすい言葉を使って管理が可能となっているのも特長だ。Enterprise Catalogは、物理的なデータの格納場所の制限を解放する。全てのデータをクラウドに上げる、あるいは大きなデータウェアハウスに入れるといったことは必要ない。そうしなくても、利用者は必要なデータがガバナンスの聞いた形で容易に集められ、利用できるようになる。
「Enterprise Catalogでは、利用者が分かる言葉でインデックス化されます。そしてデータの来歴もすぐに確認できるようになっています。これらが非常に簡単に実現できるのです」(三澤氏)