今回は第6回ということで最終回の予定でしたが、お伝えしたいことがまだまだあります!・・・ということで、残りを3回に分けて解説を続けたいと思います。もう少しだけ、お付き合いいただければと思います。今回は、Greenplum DB最大の特徴の一つでもあるシステム拡張の柔軟性についてご紹介します。
ますます困難になっていくキャパシティプランニング
従来、データウェアハウスシステム(もしくはデータベースシステムでも同様ですが)を構築するプロジェクトにおいては、厳密にキャパシティプランニングを行うのが一般的でした。具体的には、データベースに格納するデータの量、処理内容や負荷、将来的なデータの伸び率などから、必要なハードウェアのスペックやデータの格納領域、ログの格納に必要な領域と容量、必要なソフトウェアライセンスを決定していく作業です。
システムを設計する上では当然必要となるプロセスだろう、と誰もが考えることだと思いますが、最近はこのキャパシティプランニングは大変困難を伴う作業になってきています。この背景にあるのは、企業が扱うデータ量の急激な伸びと、ビジネス環境のダイナミックな変化です。
市場の伸びやトレンドが比較的穏やかに変化するのであれば、企業が扱うデータ量の変化も予測可能な範囲で推移しますが、近年の急激な情報化の進展により、市場の変化はより急激になり、製品やサービスに対するユーザーの興味も一瞬のうちに移り変わるため、データ量および処理需要の予測は非常に困難になってきています。また、企業の買収・合併によるシステム基盤の統合、グループ企業や取引先とのデータ連携システム構築など、ビジネス環境が大きく変わる可能性がある状況では、果たして設計した内容がいつまで有効かどうかという疑問すら出てきます。
もし必要な処理能力やストレージ容量を、必要なタイミングで拡張して行けるのであれば、システムに対する無駄な投資が無くなり、同時にリスクも減らすことが可能になるため企業にとっては大変大きなメリットになります。しかし、アーキテクチャ上の制限により従来のデータベースシステムではこのようなビジネス側の要求に応えることができませんでした。
この記事は参考になりましたか?
- ビッグデータのリーサルウェポン!徹底解析GreenplumDB連載記事一覧
-
- データ分析プロセスを高速化するIn-Database分析技術
- データベースとHadoopの連携
- Greenplum DBの柔軟なシステム拡張の話
【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社
この記事は参考になりましたか?
この記事をシェア