SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Enterprise IT Women's Forum

2025年1月31日(金)17:00~20:30 ホテル雅叙園東京にて開催

Security Online Day 2025 春の陣(開催予定)

2025年3月18日(火)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

MySQLとHeatWaveが切り開くオープンソース・データベースの新基準

MySQLをベクトルストアとして活用:セマンティック検索の可能性

第17回

 MySQL 9.0では、ベクトルデータ型が使えます。また、HeatWave MySQLを使うとMySQL内のテキストデータに対してエンベディングを生成したり(データの意味を考慮してベクトル化したり)、ベクトル間の距離を求める距離関数を使ってセマンティック検索(データの意味に基づいた検索)が行えます。これにより、MySQLをベクトルストアとして使うことができます。

MySQLをベクトルストアとして活用することのメリット

 近年ベクトルストアに対する注目度が上がっています。ベクトルストアを使うことで、ベクトルデータを保存できます。また、ベクトルデータの距離を求めることで類似するデータを検索できます。データベースでテキストデータを検索する時に一般的に使われるキーワード検索では、一致するキーワードがないと情報を検索できません。しかし、ベクトル検索を使うことで、キーワードと完全に一致していなくても意味的に近いデータを取り出せるようになります。

 そのため、LLM(Large Language Models)を活用する時に、LLMが持っていない知識を補完する目的でベクトルストアが使われることがあります。この技術はRAG(Retrieval Augmented Generation)と呼ばれています。HeatWaveではこのRAGを簡単に実現するための仕組みも持っているのですが、HeatWaveでRAGを簡単に実現する方法については今後の記事で解説予定です。

 ベクトルストアは、RAG以外でも様々な活用方法が考えられます。例えば、最近はSlackなどのチャットツールを使ってテキストでコミュニケーションをする機会が増えている方も多いと思いますが、過去のチャット履歴をキーワードで検索して上手く見つけられなかったことはありませんか? キーワード検索では、検索するキーワードと一致するテキストしか検索できないため、過去のチャットで使っていたキーワードを正しく思い出せないと探したいチャット履歴を検索することは難しいです。しかし、もしこのケースでベクトル検索が使えると、過去のチャットで使っていたキーワードと完全に一致していなくても、意味的に近い言葉からも関連するチャット履歴を検索できるようになります。

 ベクトルストアを使用する時、ベクトルストア専用のデータストアを使用することもできます。しかし、MySQLをベクトルストアとして使用することで、主に以下の2つの利点があります。

  1. 既にMySQL内にあるテキストデータに対して簡単にベクトル検索できる
  2. ベクトル検索を、従来のMySQLの(RDBMSの)検索機能とも組み合わせて活用できる

 HeatWave MySQLでは、テキストデータに対してエンべディングを生成する(データの意味を考慮してベクトル化する)関数が使用できます。また、テキスト情報を持つテーブルの全行に対して一括でエンべディングを生成する関数もあります。そしてベクトル間の距離を求める関数もあります。つまり、HeatWave MySQLを使うと、外部のLLMと連携する必要なく、MySQLに対してSQLを実行するだけで簡単にベクトル検索を活用できます。

 また、HeatWave MySQLでベクトル検索を行う時は、DISTANCE関数を使います。DISTANCE関数はHeatWave MySQLで使える関数の一つとして実装されています。そのため、他の検索条件と組み合わせて検索できます。例えば、先ほどのチャット履歴を検索する例で考えると、チャット履歴を保存するテーブルに発言者のユーザーID列があれば、WHERE句に「ユーザーID=XX」という条件を追加するだけで、特定ユーザーの発言だけに限定してベクトル検索を実行できます。

MySQLをベクトルストアとして活用する上での基礎知識

 本稿執筆時点で、ベクトルストアに関連する関数やルーチンとして以下のものがあります。また、ベクトルデータをテーブルに格納する時には、VECTORデータ型を使用します。

  1. STRING_TO_VECTOR関数VECTOR_TO_STRING関数:文字列で表現されたFLOATの配列データをベクトルデータに変換する関数、ベクトルデータをFLOATの配列データの文字列に変換する関数

  2. VECTOR_DIM関数:ベクトルデータの次元を求める関数

  3. ML_EMBED_ROWルーチンML_EMBED_TABLEルーチン:テキストデータに対してエンべディングを生成するルーチン

  4. DISTANCE関数:ベクトル間の距離を求める関数(※)

※VECTOR_DISTANCE関数もありますが、DISTANCE関数のシノニムとなっており、実態は同じものです。

 VECTORデータ型や1.と2.については、MySQL 9.0以降で使用できます。3.と4.については通常のMySQLでは使用できませんが、オラクルクラウド上で提供しているMySQLのマネージドサービスであるHeatWave MySQLで使用できます。そのため、MySQLをベクトルストアとして活用するためには、基本的にはHeatWave MySQLを使う必要があります。

 エンべディングの生成を外部のLLMで行ったり、ベクトル間の距離はアプリケーション側でライブラリを使うなどして求めることで、通常のMySQLをベクトルストアとして使うこともできます。ただし、その場合は前述の1つ目の利点は失われてしまうため、MySQLをベクトルストアとして使用したい場合は、HeatWave MySQLを使うことをお勧めします。

次のページ
HeatWave MySQLをベクトルストアとして活用する方法

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
MySQLとHeatWaveが切り開くオープンソース・データベースの新基準連載記事一覧

もっと読む

この記事の著者

山﨑 由章(ヤマサキ ヨシアキ)

日本オラクル株式会社 MySQL Global Business Unit MySQL Master Principal Solution Engineer & MySQL Cloud Evangelist MySQLとHeatWaveの普及を主なミッションとし、お客様環境への導入支援や製品...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/21134 2024/12/30 10:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング