AIで価値を生むには正しいデータ投入が必要
20年を迎えようとしているInformaticaの日本のビジネスは、順調に推移している。「これまでに10倍の成長を遂げ、業界のリーダーポジションにあります」とワリア氏。ETLツールの提供から始まったビジネスは、現在はクラウドデータマネジメント・プラットフォームのベンダーへと進化しており、これを提供する唯一の企業だと言う。
クラウドデータマネジメント・プラットフォームのために、Informaticaでは「Intelligent Data Management Cloud(IDMC)」を開発した。「7年前にゼロから新たなDXのモデルとして作ったのが、IDMCです」とワリア氏。IDMCはグローバルで既に5000社以上に採用されており、日本でもNTTコミュニケーションズ、商船三井、オムロンなど幅広い業種の企業で採用されている。Informaticaの売り上げ規模は約16億ドル、クラウドのビジネスが堅調に伸び35%の成長がある。「今年度上半期は市場の期待値を超える成長があり、通年の予測も上方修正しています」と言う。
Informaticaはこれまで、ETLツールのリーダーとして長く市場を牽引してきた。そんな中、7、8年ほど前からデジタルの世界では極めて多様なデータ管理のユースケースが登場する。それら多様なデータ管理のユースケースに対応できるようにするため、IDMCをゼロから開発することを決め大きな投資を行った。「ETLだけでなく、データをクラウドで管理するためのプラットフォームを作ることにしたのです」とワリア氏。IDMCは7年前にゼロからスタートし、2023年6月時点で月間61テラバイトのトランザクションを扱うに至っている。
さらにInformaticaでは、IDMCにいち早く生成AI技術を取り込んでいる。とはいえAIへの投資は、今回の生成AIが初めてではない。「2017年の段階で既にAIエンジンであるCLAIREを提供しています」とワリア氏。AI技術を搭載したCLAIREが登場してから既に5年ほどが経過し、顧客からの評価も上々だ。たとえば米国のヘルスケア企業であるCVS Healthは顧客に医療費の返金業務を行っているが、その際に必要となるデータ分析のための手作業を、CLAIREの活用で95%削減している。
具体的に生成AI技術を加えて提供するのが「CLAIRE Copilot」と「CLAIRE GPT」の2つの機能だ。Copilotは、さまざまなデータ管理のタスクを自動化し、効率性と生産性を向上させる。CLAIRE GPTは、生成AIを搭載したことで自然言語に基づくインターフェイスを実現し、それを用いて企業がデータを処理し管理、分析するのを大幅に簡素化、高速化する。「2つの機能で生産性は5倍、10倍と向上されます。さらに生成AIのインテリジェンスにより、人ではできなかったことをCLAIREで行えるようになります」とも言う。
また「そもそもデータ管理がしっかりなされていなければ、AIの価値は発揮されません」とも言う。AIで価値を得るには、包括的なデータが必要であり、多様なデータがどこにあってもモデルの学習などに適切に反映できなければならない。それには、長きに亘りデータ管理に注力してきたInformaticaの強みが発揮できることとなる。
データの品質を高めることも、AIの活用では重要だ。「AIが正しい答えを返すには、正しいデータが必要です」とワリア氏。さらに企業が安心して生成AIを使うにはデータのガバナンスも重要であり「正しい人が正しいアクセスをすることが欠かせません」とも言う。またデータの民主化が実現されることで、一部の専門家だけでなく大勢のユーザーがAIのメリットを享受できる。
ところでAIを活用する際に、学習データに偏りが出て回答にバイアスがかかるとの懸念がある。AIのバイアスを軽減するには「できるだけ包括的な、たくさんのデータで学習する必要があります。その大量なデータの品質も、担保しなければなりません」とワリア氏。CLAIREを使えば、極めて多くの種類のデータを用いたAIモデルの学習が容易に実現できる。InformaticaのIDMCを経由すれば、バイアスのないデータでAIのモデル構築ができる、そんな世界を新しいCLAIREを使い実現していきたいとワリア氏は考えている。「100%バイアスを減らすのは難しいかもしれませんが、なるべくそれに近づけるようにしたい」と言う。