そもそも「DWHが速い」とはどういうことなのか
さて、ここでいまいちど、DWHの「速さ」についておさらいしておきたい。
データベースのシステムで「速さ」をもっとも気にするのは、DWHのシステムだろう。この速さの追求は、15年ほど前に日本でDWHという言葉を使い始めたころから変わりのない究極の目的とも言える。そして、このデータウェアハウスの速さに大きく影響するのが、大量データというものの存在だ。つまり、莫大なデータをいかに高速に処理するのかが、15年以上にわたりデータウェアハウスが追い求めていることでもある。
ところで、DWHの速さと言っても、じつはその中身は1つではない。
- レポーティングなどのための定型的な検索処理の速さ
- 大量のデータをデータウェアハウスにロードする速さ
- 複雑な分析処理などのレスポンスの速さ
といったように、速さにも種類がある。さらには、これら要素すべてを網羅する「DWHのトータルでの速さ」というものもあるだろう。レポーティングなどの定型的な検索処理の速さは、インデックス機能やデータベース設計などが大きく影響を及ぼす部分であろう。このあたりを速くするための技術は、かなり古くからノウハウが蓄積されている分野でもある。
大量のデータをローディングする速さは、ハードウェア性能、さらにはDWHシステムそのもののアーキテクチャなどにも影響されやすいところだ。そして、大量データに対する複雑な分析処理は、ストレージの性能などにも大きく影響を受ける。
じつは、これら種類の異なる「速さ」は、すべてを同時に満足させるのはなかなか難しいものがある。
たとえば、定型的な検索処理を高速化しようとすると、データ更新時にはインデックス作成などに多大な時間がかかってしまい、管理手間も増大することになる。また、データロード時間を大幅に短縮するには、更新分だけをロードするようにしたいところだが、そうなると検索処理を高速化するために採用することが多いシェアードナッシング型アーキテクチャでは、あまり効率的なデータ配置ができない可能性もある。こちらを立てればあちらが立たず、それをいかにして克服するかが各ベンダーの工夫のしどころだったりもするわけだ。

この記事は参考になりましたか?
- DB Online Monthly Special連載記事一覧
- この記事の著者
-
谷川 耕一(タニカワ コウイチ)
EnterpriseZine/DB Online チーフキュレーターかつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリスト...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア