データウェアハウスの構築ポイント
本連載の第2回で紹介したデータウェアハウスの構築に関する7つの疑問につきましては、ひととおりの回答を書かせていただきました。そこで、以上の内容も踏まえ、データウェアハウスの構築ポイントを整理してみようと思います。
- データウェアハウスのシステム形態(将来像)を明確にする
- 複数の使用目的が明確な場合はセントラルウェアハウス化を指向する
- セントラルウェアハウスの構築自体をプロジェクトの目的にしない
- 何を作るか(セントラルウェアハウス/従属型データマート/独立型データマート)を理解する
- データモデルを明確にする
- セントラルウェアハウスを構築する場合は用途に特化せず汎用的なスキーマを採用する
- 従属型データマートは、初期段階では仮想的なビューの提供を優先的に検討する
- マスタデータの変更履歴を蓄積するか否かを明確にする
- マスタデータの変更履歴を蓄積する場合は正規型スキーマを採用する
- マスタデータの変更履歴を蓄積しない場合、マスタデータの変更への対応方法を明確にする
- マスタコードが変更された場合の対応方法を明確にする
- 生データのみ保持することを原則として考える
- データ種別ごとの保持期間を明確にする
- メタデータ(いつ時点のどんなデータが入っているか)の管理方法を明確にする
- OLAPを行う場合は、キューブ作成要否および作成場所を事前検証で明確にする
- ETL方式(どうやってデータを収集するか)を明確にする
- ETLをバッチ方式で行う場合は、バッチ起動間隔を明確にする
- 必要となるTransformの内容および実行場所を明確にする
- リアルタイム性の要求程度を明確にする
- リアルタイム性が要求される場合、実現方法を明確にする
- データのロード性能が要件に適合するか検証する
- データの圧縮性能が要件に適合するか検証する
- 検索性能が要件に適合するか検証する
- 同時実行性能が要件に適合するか検証する
その他、運用面の項目を少々追加しますと、
- バックアップの方式を明確にする
- 統計情報の更新、デフラグなど定期的に発生する運用作業の有無を明確にする
- スケーラビリティ、耐障害性の確保を明確にする
これまでのデータウェアハウスの構築プロジェクトを振り返ると、BIツールなどのクライアント製品に興味や関心が集中していたように思われます。このため、クライアント製品は、随分と洗練され機能も豊富になりました。しかし、データウェアハウスはデータベースの設計こそ重要であることを、本項をまとめながら改めて感じています。