
HeatWave GenAIの日本語対応状況
HeatWave GenAIの日本語対応状況について説明する時に、以下の2つを区別して説明する必要があります。
- テキスト生成を行うLLMの日本語対応状況
- エンべディングを生成するLLMの日本語対応状況
2. のエンべディングを生成するLLMについては第17回で解説したように、本稿執筆時点で(HeatWave MySQL 9.2.0 時点で)日本語のエンべディングにも対応した多言語LLMであるmultilingual-e5-smallとcohere.embed-multilingual-v3.0が使用可能です。
そして1. のテキスト生成を行うLLMについては、本稿執筆時点で以下のLLMが使用可能です。
■HeatWave In-Database LLM(HeatWave単体で動かせるLLM)
・mistral-7b-instruct-v1
・llama3-8b-instruct-v1
※厳密にはllama2-7b-v1も使用できます。ただし、このLLMはHeatWave MySQL 9.0.1-u1で非推奨になり、代わりにllama3-8b-instruct-v1の使用が推奨されています。
■Oracle Cloud Infrastructure (OCI) Generative AI Serviceと連携することで使えるLLM
・cohere.command-r-08-2024
・cohere.command-r-plus-08-2024
・meta.llama-3.1-70b-instruct
・meta.llama-3.1-405b-instruct
上記のLLMの中で、日本語に「公式に」対応しているのはCohere社が提供しているLLMであるcohere.command-r-08-2024とcohere.command-r-plus-08-2024の2つです。後ほど解説する通り、llama3やllama-3.1で日本語のテキストを生成することも可能ですが、このLLMは日本語に公式に対応している訳ではないので注意して下さい。(これはHeatWave GenAIの仕様ではなく、各LLMの仕様に依存しています)
OCI Generative AI ServiceのLLMは、本稿執筆時点でまだ全てのリージョンでは利用できず、日本では大阪リージョンでのみ使用できます。そしてOCI Generative AI ServiceのLLMを使用した場合は、HeatWave MySQLの利用料金以外に別途OCI Generative AI Serviceの利用料金がかかることに注意して下さい。
現在LLMを取り巻く環境は変化が激しく、HeatWave GenAIで利用可能なLLMとリージョンについても今後アップデートがある可能性が高いです。そのため、本記事のチュートリアルを試す前に最新情報をHeatWaveのドキュメントの「Supported Languages, Embedding Models, and LLMs」セクションで確認して下さい。
※OCI Generative AI Serviceと連携することで使えるLLMの詳細については、OCI Generative AI Serviceのドキュメントを確認して下さい。テキスト生成に使えるLLMに関する説明はこちらのページに掲載されています。