Oracle CloudWorld 2023でのMySQL HeatWave関連セッション
- 過去の連載一覧はこちらをご覧ください。
Oracle CloudWorld (OCW) 2023では20以上のMySQL HeatWaveに関連したセッションがありました。またMySQL HeatWaveに特化していないセッションでもMySQL HeatWaveに触れられることがありました。特にOracle Cloud Infrastructure (OCI)の製品戦略や開発を統括する役員であるClay Magouyrkの基調講演では、MySQL HeatWaveはオラクルにとって極めて重要な技術であることや、非常に多くの投資を行ってきたことが紹介されています。またこの基調講演にはAIやGPU関連で注目の集まるNVIDIAとVoIPサービスを展開する8x8の2社がOCIの顧客として登壇しましたが、いずれもMySQL HeatWaveを大規模に運用する企業でもあります。
第12回でご紹介したオブジェクト・ストレージ上のデータを高速に分析できるMySQL HeatWave Lakehouse関連で注目が集まったのがトヨタ自動車によるHeatWave Lakehouse検証事例のセッションです。トヨタ自動車では2022年のOCW 2022でもMySQL HeatWaveを大規模なデータ分析基盤として利用する可能性を検証するために他製品とのベンチマークなどを行った結果をリモート講演のかたちで紹介していましたが、2023年は講演者の方が会場にて発表されました。この講演の中では、コネクティッド・カーのセンサーから収集してオブジェクト・ストレージに蓄積データを活用して、トヨタ自動車独自のAIアルゴリズム開発のための機械学習基盤を開発する中で、前処理のためのデータ管理ツールとしてHeatWave Lakehouseの性能検証を行ったことが報告されていました。
MySQL HeatWaveのロードマップとしての生成AIとベクトルストアの実装
OCW 2023ではMySQL HeatWaveの新機能が多数発表されましたが、ロードマップとして紹介されたのが生成AIとベクトルストアの実装です。Oracle Database 23cにもAIベクトルを活用したセマンティック検索機能であるAI Vector Searchを追加することが発表されましたが、MySQL HeatWaveでも同様の方向性が打ち出されています。
オブジェクト・ストレージ上のデータを分析できるHeatWave Lakehouseをさらに強化する形で、以下のような仕組みになります。
- オブジェクト・ストレージ内のPDFやテキストデータなどをHeatWaveに組み込まれた言語エンコーダーが埋め込みベクトルを生成してベクトルストアに格納
- ユーザーからの自然言語での問い合わせも同じ流れで埋め込みベクトルを生成して類似性の検索を行う
- 自然言語で応答を返す
- 一般的な生成AIとは異なり、企業や組織内に蓄積された文書データを元とすることでより精度の高い応答を返す機能となることが期待されています。
この機能が紹介されたMySQL HeatWaveのソリューション基調講演では、オブジェクト・ストレージに格納された文書をベースとすることで応答の精度が上がるデモも行われました。同様の内容はMySQLのブログでも紹介されています。
生成AIとベクトルストアは、OCW2023ではPrivate Previewとして発表されましたが、近いうちに一部のお客様に触れていただけるようになることが予定されています。
OCW 2023で発表されたHeatWaveの新機能
生成AIとベクトルストア以外にもマルチクラウド、機械学習、開発者向け機能、運用自動化など幅広いテーマでの多くの新機能が発表されました。
MySQL HeatWave LakehouseのAWS対応
MySQL HeatWaveがAWS上で動作することでAWSを活用しているお客様にも使いやすいMySQL HeatWave on AWSというサービスが提供されています。このAWS版のMySQL HeatWaveにもLakehouseが追加されました。これによりS3上のCSVやParquetなどの形式のデータをHeatWave Clusterにロードして高速に分析が可能となります。2023年10月末現在はこの機能は限定公開(Limited Availability)のため、利用を希望する方はオラクルの営業担当にご連絡ください。
機械学習機能HeatWave AutoMLのLakehouse対応
第8回で紹介したMySQL HeatWaveの機械学習機能であるHeatWave AutoML (HeatWave MLから改称)がLakehouseにも対応し、これまでのMySQLサーバー上のデータだけではなく、より多くの種類のデータを機械学習アプリケーションにおける処理の対象とすることができるようになりました。
JavaScriptでのストアド・プログラム開発
Oracle Database 21cでも同様の機能が実装されていますが、さまざまなプログラミング言語に対応した仮想マシン(言語処理ランタイム)であるGraalVMをデータベースに統合し、ストアド・プログラムをSQL以外で開発できる機能がMySQL HeatWaveにも実装されます。MySQL用にカスタマイズされたGraalが組み込まれ、MySQLのスレッド・プールを活用した高い性能拡張性を持っています。またGraal EE Compilerによる最適化での高い処理性能も期待できます。第一弾としてはJavaScriptが対象言語となっています。2023年10月末現在はこの機能は限定公開(Limited Availability)です。
JSONデータ型のHeatWave対応
MySQLサーバーにはMySQL 5.7でJSONをそのまま格納できるJSONデータ型が実装されていました。このJSONデータ型MySQL HeatWaveでも対応し、HeatWaveクラスターの高い処理性能を活用して高性能なドキュメント・データベースとしての利用が可能となっています。512GBのデータを対象としたベンチマークではMySQLサーバーに対して140倍以上の性能向上をみた例も紹介されています。なお、MySQLのJSON関数は全てサポートされているわけではなく、2023年10月末現在ではブログの記事にあるもののみがサポート対象となっています。
参考:MySQL公式ブログ https://blogs.oracle.com/mysql/post/accelerating-json-query-processing-using-mysql-heatwave
Autopilotによるインデックスの作成支援
第6回でご紹介した機械学習を活用した運用支援機能であるHeatWave Autopilotの機能が拡張され、MySQLサーバーのテーブルにどのようなインデックスをしたら良いか、またはどのインデックスを削除したら良いかをアドバイスするAuto Indexing機能が追加されました。パフォーマンスやストレージを機械学習で高精度にモデル化し、実行されたSQL文から最適な構成を提案します。手動で行うチューニングよりも効率よく、場合によっては少ないインデックスでより高い検索性能を実現することもあります。更新系の処理が中心で分析エンジンとしてのHeatWaveノードを活用しない環境でも、最小構成のHeatWaveノードを追加しておくことで運用の効率化が期待できる機能となっています。
まとめ
OCW 2023ではこれ以外にもAutoMLのテキストデータへの対応やレコメンデーション・システムの強化、HeatWaveノードでの動的な圧縮アルゴリズム選択やアダプティブなクエリ実行など様々な機能強化が行われています。毎月のように機能の追加や拡張が行われているMySQL HeatWaveの今後にご注目ください。