(編集部より)今回から著者が、日本オラクル 山﨑由章氏に変わりました。過去の連載一覧はこちらをご覧ください。
HeatWave GenAI の概要と特徴
2024年7月1日、HeatWave GenAIがリリースされました。HeatWave GenAIでは、業界初のインデータベースLLM(大規模言語モデル)や、自動化されたインデータベース・ベクトル・ストアを搭載しています。これらの新機能により、AIの専門知識がなくても非常に簡単にLLMを利用し、自然言語で問い合わせてテキストを生成したり、テキストを要約したりできます。また、ベクトル・ストアを使った検索拡張生成:RAG(Retrieval Augmented Generation)の仕組みも自動的に構築できます。外部のベクトル・ストアを使わずにHeatWave GenAIだけで、RAGを使ってハルシネーション(幻覚)と呼ばれる、LLMが事実とは異なる内容や無関係な文脈の内容を出力する問題を緩和することもできます。
HeatWave GenAIは、スケールアウトによる性能拡張性や、予測可能なコスト、といったHeatWaveの特徴も持ち合わせています。そのため、LLMの応答性能やベクトル・ストアでのエンベディング処理の時間を短縮したい場合は、ノード数を増やすことで性能を改善できます。また、HeatWaveの使用料金だけで利用できるため、LLMで処理するトークン数に依存せず、大量のテキストを入力&出力しても低コスト&一定の料金で利用できます。
また、Visual Studio Code用のプラグインであるMySQL Shell for VS CodeからHeatWave Chatを利用することで、チャット形式でLLMを利用できます。HeatWave Chatでは質問の履歴やLLMへのプロンプトなどのコンテキストが維持されるため、コンテキストに基づいてチャットできます。
オラクルの発表では、オラクル社内のMySQLサポートエンジニアが利用できるナレッジ検索サービス(Ask MySQL Expert)をHeatWave GenAIを利用して構築していることについても言及がありました。Ask MySQL Expertでは、パブリックなドキュメントおよびオラクル社内のみのドキュメントをHeatWave GenAIのベクトル・ストアに格納しています。そして、MySQL及びMySQL HeatWaveに関連する質問を入力すると、ベクトル検索により質問と関連があるドキュメントを検索できます。また、関連するドキュメントの要約や質問に対する回答を生成できます。その際に、要約や回答の生成に使用したドキュメントへのリンクも表示されます。このナレッジ検索サービスについては、こちらでデモ動画も公開されています。
本稿執筆時点では、日本語に対応したマルチリンガルLLMはまだサポートされておらず、英語のLLMのみがサポートされていますが、Mistral-7BとLlama-2-7bを動かせます。マルチリンガルLLMは今後サポートされる予定です。
今回の記事では、英語を使ってHeatWave GenAIによるテキスト生成とテキスト要約のやり方を解説します。
HeatWave GenAI を使用するための準備
HeatWave GenAIはMySQL HeatWaveのバージョン9.0.0以降で使用できます。そのため、まずはOracle Cloudのアカウントを作成し、MySQL HeatWave 9.0.0以降の環境をプロビジョニングしてください。この時、HeatWaveノードのシェイプはHeatWave.512GBを使用する必要があります(HeatWave.32GBではHeatWave GenAIを使用できません)。MySQL HeatWave環境のプロビジョニング手順は、こちらのチュートリアルが参考になります(「サンプルデータベースの構築」以降の手順は不要です)。
プロビジョニングが終われば、MySQL Shell等でMySQL HeatWaveに接続し、SQLを実行できる環境を用意して下さい。