仕組みを知る者がAIを制する──数理モデルから読み解く「正しそうな嘘をつくAI」の正体とその攻略法
【動画】生成AIを最高のビジネスパートナーに育てるには? 東京工科大学 中西崇文教授に訊く
AIは「くび(身体の一部)」と「くび(解雇)」をどう見分けているのか?
竹村:中西教授の著書『ChatGPTはどのように動いているのか?』では、最新のAIも突き詰めれば「ベクトル」と「行列」というシンプルな数学に集約されると述べられています。これまでの自然言語処理(NLP)の歴史の中で、どのようなブレイクスルーがあったのでしょうか。
中西:かつての自然言語処理(NLP)は、人間が文法ルールを定義し、辞書を作って論理的に解こうとするアプローチが主流でした。しかし、人間の言語はあまりに複雑で例外が多く、この方法では限界がありました。そこで登場したのが、言葉を統計的に、つまり数値(ベクトル)として処理する手法。さらに、それらのベクトルを大量にまとめた行列として扱うことで、コンピュータでの一括処理が可能になりました。
竹村:行列として処理することの利点を具体的に教えてください。
中西:現代のAIの進化を支えているのは、GPU(画像処理装置)の存在です。画像データは、縦横に並んだピクセルの色の情報を数値化した行列の塊といえます。言語データをベクトルと行列の形式に落とし込むことで、画像処理のために開発された強力な演算能力をそのまま言語処理に転用できるようになりました。これにより、学習スピードが飛躍的に向上したのです。
竹村:技術の基盤が整った中で、現在のChatGPTなどの成功を決定づけたものは何だったのでしょうか。
中西:2017年にGoogleの研究チームが発表した「Attention Is All You Need」という論文で提唱された「トランスフォーマー」というモデル、そしてその中核にある「アテンション」という仕組みです。これ以前の手法では、長い文章になると最初のほうに出てきた単語の情報を忘れてしまうという弱点がありましたが、アテンションがそれを解決しました。
アテンションとは、一言でいえば文章中の「どの単語とどの単語が強く結びついているか」に重みをつける仕組みです。入力されたすべての単語ペアに対して類似度を計算し、文脈における重要度を“重み”として算出します。この重みが大きいほど、その単語は次に出力される言葉を決定する上で強い影響力を持ちます。この仕組みによって、AIは「くび(体の一部)」と「くび(解雇)」といった同音異義語も、文脈の重み付けから正しく判断できるようになりました。
このように説明すると非常に高度なことをしているように思えるかもしれませんが、ベースにあるのは行列の掛け算なので、仕組みは意外とシンプルです。このシンプルな数理モデルを数千億ものパラメータで実行した結果、人間のような知能を感じさせる振る舞いが現れた。これは、ある意味で人間自身の思考プロセスの再定義でもあります。我々が「考えている」と思っていることも、実は脳内でこうした反射的な統計処理や、文脈への重み付けを行っているだけなのかもしれない──AIの研究は、そうした問いを想起させます。
この記事は参考になりましたか?
- この記事の著者
-
この記事は参考になりましたか?
この記事をシェア
