ビッグデータの活用に適したMPP型RDBMSとその適用用途
第1回の記事で、Greenplum DBはスケールアウトテクノロジであるMPP (Massively Parallel Processing)アーキテクチャがベースになっているという説明をしました。MPPはサーバ台数を増やすことにより処理性能が向上するという、まさにビッグデータの処理にうってつけの技術です。特にデータウェアハウスのような、格納された広範囲のレコードを参照してレポーティングやデータマイニングを行う処理に関しては抜群の性能を発揮します。
一方でバッチ処理や参照系処理の高速化もMPP型 RDBMSの特徴を生かせる用途です。企業システムにおいて、汎用RDBMSにオンライントランザクション、検索に代表される参照系クエリ処理、バッチ処理といった異なるワークロードが共存しているケースで、検索クエリのレスポンスが悪い、もしくはバッチ処理が決められた時間内に終わらない、というシステム管理者の悩みはよく耳にします。このような場合に参照系処理を一部切り出して、複数ユーザによる頻繁な検索処理を高速化したり、バッチ処理のシステムを別にしてトランザクションDBの負荷を軽減したりするなど、高負荷な処理のオフロードによる全体最適化に有効です。