10年前の登場から再び脚光を浴びる「HTAP」は何がスゴイのか?──野心的なTiDBの構成から紐解く
第3回:データベースの悲願「HTAP」とは何か
事例:90億以上のOSSイベントデータをリアルタイムに分析
HTAPには様々なユースケースが考えられる。たとえばECや金融業界では近年、ユーザー行動データのリアルタイム分析によるパーソナライズド・マーケティングや不正検知を素早く実行することが重要視されている。またIoTではセンサーデータから危険な故障を事前検知するといった仕組みにも応用が考えられている。ここでは、TiDBのHTAP機能を使用した「OSS Inshight」というサービスを見てみたい。

「OSS Inshight」のサービス画面
[クリックすると拡大します]
OSS Insightは、HTAPの活用方法を伝えることを目的にPingCAPが開発したサービスで、オープンソースソフトウェア(OSS)プロジェクトに関するデータを分析し、視覚化することができる。このプラットフォームは、GitHub上の90億以上の膨大なイベントデータを活用して、OSSプロジェクトのトレンド、貢献者の活動、リポジトリの成長など、多角的な分析機能をリアルタイムで提供している。具体的には以下のような機能を提供している。
- トレンド分析:特定のOSSプロジェクトや技術スタックの人気度や成長率を時系列で追跡し、業界の動向を把握できる
- リポジトリの比較:スター数やフォーク数、プルリクエストの数などの指標を基に、トレンドのリポジトリをランキング形式で表示できる
- カスタム分析:自然言語で質問を入力すると、AI(LLM)を用いてSQLクエリを生成し、視覚的なデータ出力を提供する
GitHubは世界中の開発者が常に更新を行っているという意味で、24時間365日稼働するワールドワイドなOLTPシステムだと見なせる。その巨大システムからリアルタイムにデータを集計してインサイトを抽出するということは、従来のOLTP/OLAPを分離するシステム構成を前提にしては不可能なことである。HTAPデータベースによって初めて可能になった好例と言えるだろう。
HTAPの主流になるのはどっち? 「密結合 vs 疎結合」
これは筆者が個人的に行っている分類なので特に公式なものではないが、HTAPを実現するアプローチには2種類あると考えている。それが密結合と疎結合である。前述のAlloyDBやUnistoreといった単独のDBMSの中に2つの異なるアーキテクチャのデータベースを包含するのが密結合だとすれば、疎結合の代表はAWSの「Zero-ETL」である。

[クリックすると拡大します]
AWSは、OLTP(Aurora)とOLAP(Redshift)は分離しておこう、と言う。そこは保守的である。その代わり、両者を接続するETLをCDCによって極力リアルタイムに近い形でデータ連携を行う、究極的には「ETLをゼロにする」という方向の発想である。AWSはこのサービスをHTAPとは呼んでいないが、目的は分析のリアルタイム化にあるため、筆者は疎結合型のHTAPと呼んで差し支えないと考えている。
密結合型の方が、トランザクション処理と高速な分析クエリを同一システム上でシームレスに実行可能というメリットがあるが、疎結合型の方にも様々なデータソースからデータ統合が可能というメリットがある。「密結合 vs 疎結合」のどちらがHTAPの主流になっていくかは、今後数年の動向を見る必要があるだろう。
まとめ
さて、3回にわたってTiDBをモデルにNewSQLというデータベースのアーキテクチャやユースケースについて見てきた。データベースのようなバックエンドの技術は、フロントエンドの技術に比べると一般に技術革新のスピードが遅いが、NewSQLとHTAPは久々にデータベースの世界に訪れたビッグウェーブになる可能性を秘めている。当初、NewSQLは「ハイパースケールRDB」というコンセプトとして登場したが、第2回で見たように最初想定しなかった応用方法が発見されてきている。こうした新たなユースケースの発見が、社会へ浸透していく鍵になるだろう。
同様に、HTAPの浮沈もそのユースケースにかかっている。ECや金融の不正検知だけでは市場が少し小さいだろう。今後エッジデバイスやロボット、車両にもAIが搭載されてエッジAIの用途が増えてくると、膨大な量のセンサーデータをリアルタイムに分析処理する必要が出てくるため、光の当たる可能性のあるコンセプトである。今後も2つのキーワードに着目してデータベースの技術を見てもらえると、理解の助けになるのではないだろうか。
この記事は参考になりましたか?
- 新時代のデータベース「NewSQL」── TiDBに見るその魅力と可能性連載記事一覧
-
- 10年前の登場から再び脚光を浴びる「HTAP」は何がスゴイのか?──野心的なTiDBの構成...
- 3つの先行事例から学ぶ、「TiDB」を上手く使いこなす術──「分散」と「統合」の振り子関係...
- NewSQLが急速に支持を拡大する理由は?──新定番「TiDB」がもつ“ユニークさ”から探...
- この記事の著者
-
ミック(ミック)
データベース分野におけるエンジニアとして20年以上のキャリアを持つ。特に大規模データを扱うBI/DWHでの開発経験が豊富で、性能設計やパフォーマンスチューニングを得意とする。2018年より3年間、米国シリコンバレーにて先進技術の調査に従事。2025年現在は、会社全体の技術戦略の策定に従事している。D...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
提供:PingCAP株式会社
【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社
この記事は参考になりましたか?
この記事をシェア