Google Cloudのエンタープライズ向けジェネレーティブAI
2023年に入り、GoogleはジェネレーティブAIに関する取り組みを加速させている。3月にはコンシューマー向けの会話型サービスの「Bard」、プロトタイプ開発環境の「MakerSuite」の他、エンタープライズ向けには、ビジネスユーザー向けのアプリケーション開発環境「Generative AI App Builder(以降、Gen App Builder)」、機械学習プラットフォーム「Vertex AI」のジェネレーティブAI対応を発表した。セッションではこの2つのプロダクトの詳細な解説があった。
セッションの最初に登壇した下田倫大氏は、ジェネレーティブAIを支える最も重要な概念に基盤モデル(Foundation Model)があると指摘する。この基盤モデルの登場で、従来はデータサイエンティストや機械学習エンジニアが、解決したい課題ごとにデータを集め、機械学習モデルを作成し、試行錯誤をしながら精度を高めるプロセスが大幅に簡略化されることになった。ユーザーは、基盤モデルに対して指示を出すことで、自然言語でテキスト生成、画像生成、コーディングなど、様々なタスクを実行させることができる。
そもそも現在のAIの飛躍的進化は、2017年にGoogleが発明したTransformerと呼ばれる言語モデルの登場が発端である。Transformerは、問合せの意図に沿った検索を実現する基盤とし、Google Cloudの多くの自然言語処理サービスに既に導入されている。その後、言語モデルの規模の拡大に比例してその能力も発展を遂げ、大規模言語モデル(LLM)と呼ばれる現在のイノベーションへと繋がった。このLLMの能力を企業ITに組み込み、活用を促すために提供するのがGen App Builderである。同製品は、LLMが持つユーザーとのスムーズな会話の能力を生かした対話型サービス、文章の意味を深く理解する能力を応用した文書検索をできるだけ少ない実装作業で企業ITに組み込むための基盤を提供する。
ビジネスユーザー向けに提供される「Gen App Builder」とは
下田氏に続いて登壇した佐藤一憲氏は、このGen App Builderの機能詳細を解説した。
Conversational AI
まず、チャットボットを開発するための機能にConversational AIがある。従来のチャットボットでは、ユーザーとの会話のパターンを人間が設定しなくてはならない。通常、300〜500パターンの回答を事前に設定しておく必要があるが、ユーザーからは機械的に感じられるやり取りになるケースが多く指摘されていた。これに対して、Gen App BuilderのConversation AIは、LLMが問合せに対する回答をその場で生成するもので、ユーザーにとってはより自然な回答が迅速に得られる利点がある。
Enterprise Search
もう1つ、企業のITシステムを対象とする情報検索の機能を提供するものとしてEnterprise Searchがある。これは問合せの文章の意味やユーザーの意図を深く理解した検索結果を返すもので、検索結果のパーソナライゼーション、関連する文章のレコメンデーション、そして画像と文章を組み合わせたマルチモーダル検索の実現を目指しているところだ。
Enterprise Searchの特徴として、佐藤氏は「すぐに導入できる手軽さ」「セマンティック検索」「LLMの能力を生かした要約」の3つを挙げた。この中のセマンティック検索のセマンティックとは、意味のことだ。セマンティック検索は、従来型のキーワード検索とは異なり、ユーザーの検索意図を理解して結果を返す。例えば、「math practice book for adults」というクエリーを入力した場合、キーワード検索では学生向けの数学テキストが上位に表示されるが、セマンティック検索では大人のための数学入門書を上位に表示してくれる。
検索対象にできるデータはWebページ、構造化データ、非構造化データの3種類である。それぞれに対し、Enterprise Searchでは「公開されたWebサイトのURLを指定してクロールする」「BigQueryテーブルやJSONファイル等の構造化データをロードする」「PDFファイルやHTMLページ等をクラウドストレージから読み込む」の3つのデータインポート方法を用意している。いずれの場合も、インポートのための行動を記述したり、スキーマを定義したりする必要はない。例えば、3つ目のPDFファイルを検索対象にする場合、Google Researchが公開している研究論文のPDFファイル20件(全部で400ページ相当)をクラウドストレージに保存し、保存先のフォルダーを指定すると、インポートを実行する。そして、インポートしたデータに対し、「What is video localized narratives?」とクエリーを入力すると、検索結果を表示してくれる。その冒頭には要約が表示されていて、各ファイルを開かなくても、大まかな内容を把握できる。
Gen App Builderはプライベートプレビューとして公開されているもので、Trusted Testerプログラムへの応募が利用条件として設定されている。