エンタープライズ向けに提供するDuet AIとVertex AI
生成AIが熱い。ヘルスケアや法律などへと適用領域が拡がってきた。ブームを追い風に大規模言語モデル開発で知られるAnthropic、 チャットボットのcharacter.ai、商品画像生成のTypeface、動画生成のRunwayなど、将来性を期待される生成AIユニコーンが存在感を高めている他、世界中で次々と生成AIに特化したスタートアップが立ち上がっている。また、企業内での利用も、ホワイトカラー業務での資料作成にとどまることなく、プログラミングへと拡大が始まった。Google Cloud Next ’23(以降、Next ‘23)を振り返り、寳野氏は「これらの生成AIスタートアップの約7割がGoogle Cloudを利用しています」と語った。
現在のGoogle Cloudの生成AI関連ポートフォリオは、図1のようになる。
Duet AI
Next ‘23における生成AIに関する発表の目玉は、大きく「Duet AI」と「Vertex AI」の2つであった。まず、Duet AIは開発なしでユーザーが生成AIを利用できるようにしたもの。Google Cloudの各種アプリケーションにDuet AIは組み込まれ、ユーザーの業務の生産性向上に貢献する。Duet AIは、元々は5月の開発者向けのカンファレンス「Google I/O 2023」で発表したもの。今回のNext ‘23では、Google Workplaceに対応する「Duet AI for Google Workplace」の英語版での正式提供が発表になった。Google Workplaceを契約している法人企業のユーザーは、Gmail、Google Docs、Google Sheets、Google Slidesなどで生成AIの機能を業務に利用できることになる。
Vertex AI
もう1つのVertex AIはAI開発環境であり、企業が独自の生成AIを開発するためのソリューションを提供するもの。コンタクトセンターやドキュメント管理のようなビジネスソリューションを提供する「AIソリューション」、ビジネスソリューションを裏側で支える「Search」「Conversation」、生成AIの開発、カスタマイズ、拡張のための「AI Platform」、Google独自のモデルを含む様々なモデルを集めた基盤モデルライブラリーの「Model Garden」から成る。それぞれは緊密に連携しており、全体を支えるのがGPU、機械学習専用のTPU(Cloud Tensor Processing Unit)、GoogleのData & AI Cloud、そしてエコシステムを構成する広範なパートナーである。また、生成AIの提供ではとりわけ重要な「責任あるAI」の方針を徹底していることを寳野氏は改めて強調した。
基盤モデルPaLM 2、Imagen、Codeyがアップデート
そして、Next’ 23におけるAIに関する発表テーマは、以下の3つだったと寳野氏は振り返り、テーマごとに主要発表を紹介した。
- Googleの最先端のテクノロジーによるイノベーション
- 統合され、オープンなAIポートフォリオによる素早い開発と大規模スケール
- エンタープライズレディ
PaLM 2
1番に関しては、Google独自の基盤モデルのアップデートがある。Vertex AIでは、大規模言語モデルの「PaLM 2」、画像生成モデルの「Imagen」、プログラミングコード生成モデルの「Codey」などをAPIから呼び出して使う。Googleが取り組んだのは、まずPaLM 2のサポート言語とトークン数の拡大である。日本語を含む38に拡大し、さらに入力トークンの上限を8,000から32,000に引き上げた。このトークンとは、テキスト4文字に該当し、英単語における100トークンは60〜80単語に相当する。今回のアップデートはプロンプトから入力できるテキストの文字数が増えたことになる。
日本では、8月22日に行われた「Google Cloud Generative AI Summit Tokyo」で、既にPaLM 2の日本語対応を発表している。同時に、顧客からのフィードバックを得て、これまではトークンベースだった料金体系を文字数ベースに改めてもいる。これについて「トークンベースはわかりにくいという意見が寄せられていました」と寳野氏は打ち明け、より透明性の高い料金体系に変えたと説明した。また、日本企業からの協力を得て、モデルの精度も向上している。日本語でのPaLM 2の精度は、実用日本語検定「J.TEST」の「A-C レベル試験」(上級者向け)で正答率94%に達した。これは日本語でのダジャレを認識できる水準に相当する。
ImagenとCodey
Imagenでは生成画像の改善に加え、生成した画像に肉眼では見えない形で埋め込む「デジタル透かし」を実装した。CodeyもPaLM 2と同様に日本語に対応している。Codeyは日本語で指示を出してコードを生成する機能の他、チャットでのやり取りを介して不明点の解消、コードの補完ができる機能を提供している。日本語での指示を含む、Codeyの生成コードの品質は全体で25%の改善効果を得た。
また、各種アプリケーションで基盤モデルを利用するときに重要なEmbeddingsも日本語に対応した。Embeddingsは意味ベースの検索や分類を実現する基礎技術で、画像のような非構造化データであってもその特徴を抽出してベクトルに変換する。ファインチューニングなしで、画像の意味を理解して検索結果を返すなど、単純な単語だけをマッチングする処理では難しかった高度な検索が可能になる。さらに、用途に合わせてモデルをチューニングしたいという要望に応え、ImagenとCodeyでは、一部のパラメーターだけをチューニングする手法の1つ「アダプターチューニング」も利用可能になった。