ビッグデータの活用に適したMPP型RDBMSとその適用用途
第1回の記事で、Greenplum DBはスケールアウトテクノロジであるMPP (Massively Parallel Processing)アーキテクチャがベースになっているという説明をしました。MPPはサーバ台数を増やすことにより処理性能が向上するという、まさにビッグデータの処理にうってつけの技術です。特にデータウェアハウスのような、格納された広範囲のレコードを参照してレポーティングやデータマイニングを行う処理に関しては抜群の性能を発揮します。
一方でバッチ処理や参照系処理の高速化もMPP型 RDBMSの特徴を生かせる用途です。企業システムにおいて、汎用RDBMSにオンライントランザクション、検索に代表される参照系クエリ処理、バッチ処理といった異なるワークロードが共存しているケースで、検索クエリのレスポンスが悪い、もしくはバッチ処理が決められた時間内に終わらない、というシステム管理者の悩みはよく耳にします。このような場合に参照系処理を一部切り出して、複数ユーザによる頻繁な検索処理を高速化したり、バッチ処理のシステムを別にしてトランザクションDBの負荷を軽減したりするなど、高負荷な処理のオフロードによる全体最適化に有効です。

この記事は参考になりましたか?
- ビッグデータのリーサルウェポン!徹底解析GreenplumDB連載記事一覧
- この記事の著者
-
松下正之(マツシタマサユキ)
EMCジャパン株式会社 データ・コンピューティング事業本部 テクニカル・コンサルタント。 外資系H/Wベンダーにて、Oracle DB/RACを使った大規模・高可用性システムの提案・導入技術支援を中心に、ISV(独立系ソフトウェアベンダー)とのテクニカルアライア...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア