急進化中の自然言語処理分野、「GPT-3」に注目
人工知能(AI)と機械学習(ML)は、これまでコンピュータサイエンスの裏方を担うような技術でしたが、いまでは実装が進み、主流の技術になりました。AIの実装は私たちが買い物をする方法から貨幣市場や医学研究に至るまで、あらゆる分野に及んでいます。
GPT-3(Generative Pretrained Transformer、文章生成言語モデル)は自然言語処理(NLP)において初めて1,000億を超えるパラメータを使用したモデルです。最近では、1兆パラメータのモデル(T5-XXL)が開発されています。これらは、記事を書いたり、文章を分析したり、翻訳をしたり、さらには詩を作ったりするのにも使えます。こうした大規模なモデルは、一つ一つ分離されたモダリティで訓練されてきました。
それと並行して、画像認識や画像生成に使われるモデルも、より多くのデータセットを使って学習され、大幅に改善されています。そこで見えてきたのは、これらの大きなモデルを変えずに、2つ以上のAIモデルを組み合わせることで得られる可能性です。昨今では、多くの費用をかけずに大規模なモデルを組み合わせることができるようになりました。これによりAIを使ってテキストを解釈し、全く新しいイメージを生成することができるようになります。
また、1つのモデルのアーキテクチャを使って、異なる領域にまたがった問題を解決することができるかがわかってきています。一例として、NLPモデルを強化するアーキテクチャが、生物医学研究でどのように使用されているかを説明しましょう。生物医学の領域では、DNAやアミノ酸などのコードの配列が分析に使われています。コードの配列は、未知の構造を持つ一種の言語として扱うことができるので、NLPモデルで使用されているアーキテクチャは、生物以外の領域でもコードの配列を理解し、生成するための潜在性があるのです。2021年初頭の印象的な例として、生物医学の研究者が、ウイルスの突然変異を予測し、タンパク質の折り畳みを理解するために言語モデルのアーキテクチャを使用しました。現在利用可能なワクチンのいくつかの作成にとって重要な課題解決の糸口を見つけられるかもしれません。
ヘルスケアとバイオメディカル研究におけるAI
新型コロナウイルスのワクチンに適応されるメッセンジャーRNA(mRNA)のプロトタイプは、遺伝子コード配列のデジタル化ツールと、遺伝子コード配列からmRNAを生成する転写ツールのおかげで、数日で開発されました。SARS-Cov-2ウイルスの新しい変異を予測するAIの助けを借りれば、mRNAワクチンの開発プロセスはさらに速くことが期待されます。
機械学習とAIは、臨床医や研究者の代わりになるのではなく、これらの専門家がより迅速に作業し、仮説を迅速に検証できるように支援する技術です。物理的な世界で細胞培養の成長を待つのではなく、これらのモデルを使って、デジタルシミュレーションで何が起こるかをはるかに速く理解することができます。
AIは診断ツールとしても利用できる。米国ではFDAによってレントゲンを読み取ることが承認されただけでなく、AIは誰かが咳をしている音を聞いて、その患者がCOVID-19や他の病気にかかっている可能性があるかどうかを判断するツールとしても利用されています。
心拍数や体温、血圧などの重要な要素をモニターできるデバイスを身につける人が増えているため、そのデータを使って医師が患者の状態をより深く知ることができるようになります。また、医師や他の臨床医が患者の記憶に頼ることがなくなるため、診断を行う際の精度も向上します。