Googleの独自開発基盤モデル:PaLM 2、Codey、Imagenの進化
Google Cloudが提供するVertex AIは、元々はフルマネージド型の機械学習プラットフォームとして提供していたものだが、2023年3月の生成AI対応を機に、生成AIアプリケーション開発からデプロイまでを一気通貫で行うプラットフォームとして強化された。2023年6月から9月にかけて、Vertex AIの顧客アカウント数は50%増、アクティブなプロジェクト数は700%増と、世界中の企業が積極的に生成AI活用に取り組んでいる。
Vertex AIを利用したアプリケーション開発は、基盤モデルの選択から始まることが多い。そのためのカタログとして用意されている環境がModel Gardenになる。Model Gardenには、生成AIを活用したい企業がユースケースに応じて最適なものを選択できるよう、100を超える多様な基盤モデルを揃えている。その中身は、大きく「Googleが独自に開発したモデル」「Googleが開発したドメイン特化型モデル」「パートナー開発のモデルあるいはオープンソースのモデル」に分類できる。
このうち、「Googleが独自に開発したモデル」に分類されるのが、LLMの「PaLM 2」、コード生成のための「Codey」、画像生成のための「Imagen」である。まず、PaLM 2については、日本でのイベントに先立ち、8月末に米国で行われたGoogle Cloud Nextで、日本語を含む新言語に対応した他、入力トークンの長さが4倍に増加し、より長い文章の処理が可能になった。また、Codeyについても、コード生成とチャットの品質が25%改善した。さらに、Imagenについても、Style Tuningというブランド独自のスタイルと一貫性を持たせた画像を生成する機能を追加している。
この3つの基盤モデルのうち、Google クラウドAIディレクターのアーワン・メナード氏はCodeyのチューニング機能の一般提供開始を発表した。CodeyはPaLM 2がベースになっており、自然言語による開発者の指示に基づいてコードを生成する機能、チャットで会話しながらコードに関連する質問に回答する機能、コードの足りない部分を補完する機能などを提供している。今回の強化では、企業が独自に蓄積してきたコード資産から安全に情報を抽出し、既存のコードで最適に動作するように出力結果をチューニングできるようにした。
中外製薬の生成AIを活用した創薬プロセス革新
「Googleが開発したドメイン特化型モデル」の例として、基調講演で紹介されたのが2023年3月に発表した「Med-PaLM 2」である。医療分野では、他のLLMのユースケースとは異なり、患者の幸福を守るために、安全性や公平性の確保と共に、バイアスの排除に最大限の注意を払う必要がある。この基盤モデルは、「PaLM-E(Pathways Language Model with Embodied)」を基に開発されたもので、医療分野の専門用語の学習に加え、画像の説明、物体の検出、シーンの分類などの視覚的なタスクを実行できるように強化されたLLMになる。例えば、胸部X線写真やマンモグラフィ画像のような放射線医学の画像の他、皮膚学、網膜、病理学、健康記録、ゲノミクスなど、さまざまな領域の画像を学習し、医学的な質問に対して正確で質の高い回答を提供するように設計されている。
このMed-PaLM 2を導入することを決めたのが中外製薬である。中外製薬は「CHUGAI DIGITAL VISION 2030」を掲げ、2019年からDXに取り組んできた。その戦略の柱は「デジタル基盤の強化」「全てのバリューチェーンの効率化」「デジタルを活用した革新的な新薬創出」の3つであり、生成AIは、3つ目の「デジタルを活用した革新的な新薬創出」を実現するための施策に欠かせないものとして位置付けられている。
通常、1つの新薬が「創薬研究」「開発研究」「臨床試験」のプロセスを経て、世の中に出るまでにかかる時間は10〜15年、費用にすると3,000億円以上にもなる。Med-PaLM 2の利用は、この長いプロセスの中でも臨床試験の効率化に役立つものと、中外製薬は捉えている。その適用領域は臨床試験計画作成だ。「Med-PaLM 2は、チャットボット形式で、膨大な量の医療文書でも短時間で検索、処理し、臨床試験計画に必要な情報を抽出してくれる。文書のドラフト作成も代行してくれるため、臨床試験計画の作成にかかる時間を大幅に短縮できる」と、登壇した中外製薬株式会社 上席執行役員 デジタルトランスフォーメーションユニット長の志済聡子氏は生成AI活用で実現する効果に向けて期待を寄せた。
さらに、中外製薬では、プロセスの最上流にある創薬研究での生成AI活用も検討中だ。このフェーズで利用するのは、Googleのグループ企業Google DeepMindが提供しているオープンソースソフトウェア「AlphaFold2」になる。これは、アミノ酸配列からタンパク質の三次元構造を予測するツールで、単なる解析時間の短縮にとどまらず、より多くの候補薬の発見に貢献すると期待されている。タンパク質の機能を決める構造は、紐状のアミノ酸がねじれたりよじれたりと、複雑に折り畳まれた状態になっている。その構造を理解することは、病気についての理解を深める上で非常に重要になるためだ。製薬会社のビジネスの本丸とも言うべき創薬プロセスにAIを適用することは、「難病に苦しむ人たちにより早く新薬を届けること」に貢献するはずだ。