SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Data Tech 2024

2024年11月21日(木)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

DB Press

TiDBがベクトル検索機能を追加、専用ベクトルデータベースとの差別化はどこに?

TiDB Serverlessへの機能追加で「RAG」を強化


 2024年2月1日、PingCAPがフルマネージドのDBaaS(Database-as-a-Service)「TiDB Serverless」にベクトル検索機能を追加したことを明らかにした。ベクトル検索は、テキストや画像などのデータをベクトル値に変化し、ベクトル間の類似度を計算することで関連情報を見つけ出す検索方法だ。生成AIの活用において、関連情報をプロンプトとLLMに渡すことでハルシネーションを軽減し、解答精度を向上させるRAGが注目されているが、これを利用する際に関連性の高い情報を見つけるために欠かせない仕組みでもある。

専用ベクトルDBにはない、TiDBに機能追加する意味とは

 ベクトル検索を実現するためには、大きく2つの方法が考えられるだろう。1つは、専用のベクトルデータベースを用いる方法だ。Facebook AI Researchが開発した、大規模なベクトル検索に特化したライブラリの「Faiss」、大規模ベクトルデータの管理と検索に特化したオープンソースプラットフォームの「Milvus」、ベクトル検索に特化したクラウドサービスの「Pinecone」など、生成AIのブームも後押しして多様な製品・サービスが提供されている。

 もう1つの方法が、既存のデータベース製品に追加された“ベクトル検索”機能を利用するものだ。たとえば、Oracle Database 23aiではVector Search機能を提供しており、PostgreSQLにはpgvectorがある。また、Amazon DocumentDBとDynamoDB、Azure Cosmos DB、Google BigQueryなど、今や多種多様なデータベースにベクトル検索機能が追加されている状況だ。

 PingCAP CTO兼共同創業者 Ed Huang氏は、ベクトル検索はTiDBにとって「サイドカー」的であり、「専用のベクトルデータベースでは、大容量データをサポートすることが難しい製品もありますが、元々大きな拡張性を持つTiDBにベクトル検索機能を加えることで、その問題を解決します」と話す。そもそもベクトルデータベースを利用する際には、類似するベクトル情報がヒットすれば、その元となったデータを参照することになる。元のデータは既存のデータベースなどに別の形で管理されているため、それらを融合して利用することは簡単ではない。

 一方、TiDBのようなリレーショナルデータベースに元のデータを入れておき、同じデータベースにベクトル値も格納しておけば、それらを一緒に活用することは容易だ。関連する別の情報などもSQLで“JOIN”して検索することも簡単にできる。1つのデータベースで管理できれば、AI機能開発におけるデベロッパーの工数を削減できるとHuang氏は主張する。

PingCAP CTO兼共同創業者 Ed Huang氏
PingCAP CTO兼共同創業者 Ed Huang氏

 もう1つの利点は「拡張性」だ。もはや、すべてのビジネスデータを取り込んだLLMを独自に構築することは、コストや手間などからも現実的ではない。そのためRAGを用い、既存のLLMなどに最適な情報を与えることで、個社ごとのビジネス目的にあった精度の高い結果を得るようになっていくだろう。RAGは今後企業が生成AIを活用する上で主流の方法となり、その際にいかに関連性の高いデータを渡せるかが重要となる。その効率を良くするには、膨大なデータの中から類似性の高いものを確実に見つけられる必要があり、このときに分散型データベースかつ高い拡張性を持つTiDBが有効というわけだ。

 先述のように、既存のデータベースにベクトル検索機能を追加する動きは多数見受けられる。とはいえ、たとえばPostgreSQLのpgvectorは現時点でシングルノードにしか対応しておらず、大規模なベクトルデータの要求には応えられないとHuang氏。また、Oracle Cloud Infrastructure(OCI)のクラウドサービスである、MySQL HeatWave Database Serviceにベクトル検索機能を追加するとのアナウンスはあるが、コミュニティ版にはまだベクトル検索機能が追加されるとの話になっていない。そのため、AWSやGoogle Cloudなど、マルチクラウドで利用できるTiDBにいち早く機能追加をすることで、市場での優位性も築けそうだ

 その上で、TiDB Serverlessにベクトル検索機能を追加することで、コスト面でもメリットを発揮できるとHuang氏は語る。TiDB Serverlessは、クラウドネイティブなアーキテクチャとAmazon S3などの安価なオブジェクトストレージを活用し、コスト削減に注力したサービス。これをベースに大量のベクトルデータを扱えるようにしたことで、コスト効率の良いベクトル検索機能が提供できるのだ。

次のページ
ベクトル検索機能をきっかけに「エンタープライズデータベース」として市場拡大を目指す

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
DB Press連載記事一覧

もっと読む

この記事の著者

谷川 耕一(タニカワ コウイチ)

EnterpriseZine/DB Online チーフキュレーターかつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリスト...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/19825 2024/06/17 12:11

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング