SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Enterprise IT Women's Forum

2025年1月31日(金)17:00~20:30 ホテル雅叙園東京にて開催

Security Online Day 2025 春の陣(開催予定)

2025年3月18日(火)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

変化する情報活用ニーズ、進化しないデータウェアハウス

データウェアハウス構築の秘訣(2)

第4回

 前回に続いて、今回も、「リアルタイム性」や「OLAP」の話題を中心に、さらに深くデータウェアハウスの構築ポイントを解説していきます。

ETLの必要性とリアルタイム性

 データウェアハウスやデータマートは、業務系システムで発生したデータをコピーして作成します。必要なデータは存在しているのに、なぜ別のデータベースにわざわざコピーするのかと言えば、企業内に散在しているデータを統合して横串(部門横断的)に見たいという要求があること、業務系システムでは保持できない長期間のデータに対する分析要求があること、さらに業務系システムにおける更新系処理と参照系処理の競合を回避し使用目的に適合したデータベースを構築するのが合理的であることなどがその理由として挙げられると思います。いずれにせよ、業務系システムとは別のデータベースにコピーするというのが大前提になっています。

 では、どうやってコピーするかということでETLプロセスが登場します。したがって、ETLの方式に関して議論の余地は多々あると思いますが、ETLプロセス自体は必須です。ただし、Transformの必要性については個々のシステムに依存すると思っています。たとえば、水平分散している業務システムのデータを単純に一箇所に集めてデータウェアハウスを作成するような場合、Transformは必要ないかもしれませんので、システム提案の段階で調査しておく必要があります。

 また、E-T-LかE-L-Tかという点については、適材適所で考えればよいと思います。私は、非RDB形式のデータをRDB形式へ変換したりホストの文字セットをデータウェアハウスの文字セットに変換するなど、データウェアハウスへのロード前に行わなければならない作業はETLツールを使用し、導出データを追加したり同音異義や異音同義を修正するなどの作業はロード後にSQLで一括して処理するという方式を好んで採用しています。

データウェアハウスのリアルタイム性

 次に、リアルタイム性について少々お話します。

 ETLツールの使用が前提になっているプロジェクトでは、初めからETLツールを使用したバッチ処理を念頭にETLプロセスの設計が進みます。しかしそうでない場合、どうやってデータを収集するのか、ただ持ってきて入れるだけでよいのか、どこまでリアルタイムにできるのかなど、いろいろな疑問が飛び交うことになります。

 特にリアルタイムの要求がある場合、ETLプロセスはバッチ処理だと言っても、バッチ起動間隔の合理的な説明ができないため、2フェイズコミット方式やレプリケーション、あるいは業務系システムの更新トリガでリモートのデータベースを更新するといった分散システムにおける同期技術を使用してデータウェアハウスを作成するという方向に話が進むこともあります。

 リアルタイムを要求されるようになる以前、私はデータウェアハウスへのデータロードは1日に1回、夜間バッチで行うべきだと考えていました。データウェアハウスは参照ユーザ専用のデータベースであるべきで、そのためには更新処理によるハードウェア・リソース(CPU、メモリ、ディスク)の競合、およびRDBMSの排他制御(論理ロック)は発生させてはならないと考えていたからです。そこで、もしリアルタイム性を要求された場合は、当日分のデータは業務系システムを参照し(このためにODSを作成するという方法もあるでしょう)、データウェアハウスの前日以前のデータと合算する仕組みがあればよいと考えていたのです。

次のページ
OLAPとキューブ

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
変化する情報活用ニーズ、進化しないデータウェアハウス連載記事一覧

もっと読む

この記事の著者

サイベース 本庄 朗人(サイベース ホンジョウ アキヒト)

サイベース株式会社 プロフェッショナルサービス本部 担当部長。大手独立系SI企業を経てサイベース入社。90年代後半からデータウェアハウスの構築プロジェクトに従事、現在に至る。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/178 2008/11/07 11:51

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング