2023年8月2日、Clouderaは「Evolve 2023 Tokyo」を開催。今回はハイブリッド形式で実施され、約800名が参加する賑わいをみせた。
Cloudera 社長執行役員 大澤毅氏が「生成系AIのトレンドとしての勢いは凄まじく、これに付随するアプリケーション市場も伸長している」と切り出すと、構造化データだけでなく非構造化データを取り込めるデータレイクハウスが必要になっていると話し、米Cloudera VP Product Management Priyank Patel氏の講演「生成AIの可能性と限界」に水を向けた。
同氏は、企業が本番環境でどのように生成AIを導入しているのか説明を始めると、従来のMLモデルではトレーニングデータやアルゴリズムを収集していくために専用モデルを構築する必要があり、数年単位で運用していく中でデータクレンジングなどが必要とされていたことに触れる。一方、LLMにおいては、汎用的なモデルを利用するためデータサイエンティストだけでなく、多くの開発者がアプリケーション構築に係わることができる点が特徴的だという。その上でChatGPTなどのサービスを鑑みたとき、「文脈の認識」「強力なプライバシー」「ホワイトボックス」という3点が重要になると指摘する。
特に文脈の認識については、ClouderaのAMP(Applied ML Prototypes)機能を利用することで、汎用モデルにおける社内用語などに関する適切な回答を出せるという。このときシステムの裏側では、文脈に沿わない回答である「ハルシネーション」となる答えが導きだされるとき、汎用モデルを変えず、企業向けのナレッジベースを通して導き出すことで企業内利用に耐え得るだけの回答を得られるとした。
「皆さんが持つデータのコンテクストが重要であり、それこそがAI戦略における差別化要因になる」とPatel氏。Stanford AlpacaやStarCoderなど新たなLLMモデルが乱立している状況下にあるため、ハイパースケーラーにしか構築ができないわけではなく、“オープンソースの力”が増していると述べる。実際にシンガポールに拠点を置くOCBC(Oversea Chinese Banking Corporation)では、400万ほどの意思決定にAIを活用しているという。同行においては「OCBC Wingman」というAIによるコード補完サービスを提供しており、Github Copilotと比較しても80%安価に済んでいると強調する。さらには、コンタクトセンターにも生成AIを実装しており、会話音声をテキストに変換して要約したテキストを生成するなど業務削減にも寄与できているとした。
「重要なのは変わらない点にフォーカスを当てることだ」として、セキュリティやガバナンス、エンタープライズ企業向けの対応、オープンコミュニティの活用、コスト管理、データプラットフォームなどを例として挙げると、「今後のデータ戦略を考えるにあたり『あなたのデータプラットフォームは、あなたのAIプラットフォーム』だということを忘れないでください」と締めくくった。
続いて、Clouderaを活用した事例としてJPX総研 ITビジネス部 課長 坂本貴康氏が登壇。「Cloudera Data Platformの採用効果と今後の取り組み」と題して講演を行った。同社はJPXグループにおいてデータ・デジタル事業を担っているという。
同社では、社内への情報提供、業務用に情報を加工するバックオフィス系と、各種データを蓄積管理し、各システムに情報提供するデータ蓄積マスタ系の2つを対象として「Cloudera Data Platform」が採用された。採用に至った理由として坂本氏は「複数システムにおける重複データの整理、ユーザー部門がデータを容易に活用できるような製品を探していた」と説明する。取引データの増大に耐え得るだけの仕組みを構築するため、高速処理かつスケーラビリティがある点に加えて、開発者スキルの低減、既存の開発資産を活用した内製化の拡大、SQLを有効活用できる点なども重要視していたという。
Cloudera Data Platformの採用によって前述した課題解消はもちろん、データの一元管理ができるようになったことで業務部署の利便性が向上し、新規ビジネスの検討も可能になるという副産物も得たと坂本氏。また、夜間バッチ処理が従来朝方までかかっていたところを大幅に前倒しできたことに加えて、高速なデータ基盤が構築できたことで社内外に向けて迅速なデータ提供も可能になったとする。
なお、同社では今後クラウド上に一部データを移行する際には、「Cloudera Data Platform Public Cloud」の利用を検討しているという。今まさに事前検証を行っている最中だとして、オンプレミス版と同様の業務処理が動き、性能も担保できているという。一方で、同社のセキュリティ要件に沿うか確認しているところでもあり、これがクリアになれば導入に舵を切れるとも話す。最後に坂本氏は「Cloudera Data Platformが提供する各種サービスを活用することでデータマネジメントを高度化でき、より鮮度の高いデータを提供できるようになるのでは」と期待を寄せると、JPXグループとして市場参加者に向けて引き続きより良いサービスを提供していきたいと締めくくった。
【関連記事】
・塩野義製薬がさらなるデータ利活用のため、クラウドプラットフォームにClouderaを採用
・Cloudera、脱「Hadoop」でハイブリッドデータカンパニーを目指すための新戦略を発表
・Cloudera、NVIDIAとの協業でAIによるデータ分析を高速化