SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

生成AIの企業活用

【AWS 生成系AI勉強会】基盤モデルの活用とカスタマイズ、AIアプリ開発支援サービス「Amazon Bedrock」について

AWSジャパン 小林正人氏「生成系 AI (Generative AI)勉強会」発表レポート


 AWSジャパンは、6月29日にジェネレーティブAIをテーマに据えた記者向けのオンライン勉強会を開催した。大規模言語モデル(LLM)とサービスとの違い、裏側で動く「基盤モデル」の仕組み、ハルシネーション(幻覚)、ファインチューニングとプロンプトエンジニアリングなどの基本をくわしく解説するとともに、AWSが提供するサポート内容について紹介した。

従来型AIを変えた基盤モデルの登場

 ジェネレーティブAIと従来のAIの決定的な違いは、裏側で動く基盤モデルの存在にある。数値列を入力すると数値列を返すなど、シンプルな入力に対してシンプルな出力を返す。あるいは、画像を入力すると、その画像が何かをテキストで返すというように、複雑な入力に対してシンプルな出力を返す。これが今までの機械学習や深層学習ができることであった。それが基盤モデルの登場で、複雑な入力に対して複雑な出力を返すことが可能になった。質問を入力すると答えを返してくれるチャットボット、指示を入力すると画像コンテンツを作ってくれるサービスのように、簡単なプロンプトで多様なタスクを実行するAIを実現したのが基盤モデルである。小林正人氏は、基盤モデルの特徴として「一定の汎用性」を挙げた。

基盤モデル

 これまでの機械学習モデル構築の最大の課題は、事前準備の負担が大きいことにあった。そもそもモデルは特定の用途に合わせて個別に構築するもので、モデルの精度を決めるのは、どれだけ大量の正解データを収集し、モデルに与えて学習させることができるかに依存していた。エンジニアがモデルの先生になり「これを受け取ったら、こんな結果を出力するんだよ」と、大量のデータにラベルを付け、モデルに与える必要があった。この教師あり学習の前提を大きく変えたのが基盤モデルである。

図1:汎用的なタスクを実行できる基盤モデルの仕組み 出典:AWSジャパン
図1:汎用的なタスクを実行できる基盤モデルの仕組み 出典:AWSジャパン [画像クリックで拡大]

 基盤モデルはラベルなしでも学習が可能で、大量データを直接入力できる。用途ごとにモデルを個別に構築する必要もない。様々なタスクを実行させられるので、テキスト生成にも、要約にも、情報抽出にも「汎用的に」使える(図2)。基盤モデルはエンジニアの負担を大きく軽減することに成功した。

図2:基盤モデルと従来の機械学習モデルとの違い 出典:AWSジャパン
図2:基盤モデルと従来の機械学習モデルとの違い 出典:AWSジャパン [画像クリックで拡大]

 現在、基盤モデルが提供する機能は大きく3つに分類できる(図3)。1つ目は「Text-to-Text」で、テキストで入力するとテキストで出力するものだ。2つ目が「Text -to-Embeddings」で、テキストを入力すると、そのテキストを数値表現に直し、その数値表現に近いものをテキストに直して出力する。例えば、「ハンドソープ」と入力すると、「ハンドソープリフィル」「ハンドソープディスペンサー」「抗菌ハンドソープ」といった出力を返す。3つ目が「Multi-modal」で、テキストから画像を生成するものがわかりやすい例になる。

図3:機能ごとに見る基盤モデルの種類 出典:AWSジャパン
図3:機能ごとに見る基盤モデルの種類 出典:AWSジャパン [画像クリックで拡大]

基盤モデル活用ではテクニックも必要

大規模言語モデル(LLM)

 基盤モデルには様々なものがあるとは言え、ビジネス利用での期待が最も高いのは「Text-to-Text」のものだ。「Text-to-Text」の基盤モデルは、一般に大規模言語モデル(LLM)と呼ばれ、OpenAIのGPT-3.5/GPT-4GoogleのPaLM 2が代表的なものになる(図4)。AmazonでもネイティブLLMとしてAmazon Titan TextAmazon Titan Embeddingsを提供している。よくある誤解がサービスの名前と基盤モデルの名前を混同することだ。「それぞれが違っていることもあるので、切り分けて理解するべきです」と小林氏は語る。例えば、OpenAIのChatGPTはサービスの名前で、GPT-3.5やGPT-4がLLMの名前になる。

図4:基盤モデルと大規模言語モデル(LLM) 出典:AWSジャパン
図4:基盤モデルと大規模言語モデル(LLM) 出典:AWSジャパン [画像クリックで拡大]

 また、基盤モデルは「オープンソース」と「プロプライエタリー」のライセンス形態で分類することもできる。現在、オープンソースの基盤モデル構築が活発に進んでいる。また後者の代表例が前述のGPT-3.5で、有償での商業利用が可能だ。2023年3月にブルームバークが発表したBloombergGPTは、金融ワークロードに特化したLLMとしてAWS上で開発したものになる。

ハルシネーション(幻覚)

 企業がジェネレーティブAIを業務で利用する場合、自社のデータを学習材料に使われる点が懸念される。同時に、「ハルシネーション(幻覚)」と呼ばれる「AIが嘘をつく」現象も大きな懸念点だ。例えば、コールセンターのような顧客に直接対応する業務で、事実ではない内容を含む出力結果が出てきた場合、結果をそのまま使うわけにはいかない。少なくとも事実ではない結果を出さないようにするには、コントロール手法が必要になる。小林氏は2つの手法を紹介した(図5)。

図5:ハルシネーション(幻覚、Hullucination) 出典:AWSジャパン
図5:ハルシネーション(幻覚、Hullucination) 出典:AWSジャパン [画像クリックで拡大]

ファインチューニングとプロンプトエンジニアリング

 1つは、基盤モデルのファインチューニングである。これは既に提供されている学習済みの基盤モデルに対し、追加で学習用のデータを渡し、より望ましい結果を得られるようにモデルを改良するアプローチである。特定分野のデータを学習させ、より自分たちに適したモデルを作ることができるし、ゼロから基盤モデルを構築するわけではないので、スピーディな改良が期待できる。

 もう1つはプロンプトエンジニアリングである。例えば、テキストで答えを返してくれる基盤モデルであれば、ユーザーが工夫した質問を投げかける。あるいは「わからない場合は“わからない”と答えるように」と明確に指示をすることで、出力をコントロールするアプローチがプロンプトエンジニアリングに該当する。また、基盤モデルが英語しか理解できない場合、日本語に対応するよう翻訳処理を追加するなど、「アプリケーションに処理を追加することもプロンプトエンジニアリングの一種です」と小林氏は解説した。

図6:基盤モデルのコントロール手法 出典:AWSジャパン
図6:基盤モデルのコントロール手法 出典:AWSジャパン [画像クリックで拡大]

次のページ
基盤モデルをカスタマイズする方法

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
関連リンク
生成AIの企業活用連載記事一覧

もっと読む

この記事の著者

冨永 裕子(トミナガ ユウコ)

 IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/18011 2023/07/06 09:57

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング