SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

DB Press

ビッグデータ時代のDWHは「安さ」と「速さ」/EMC Greenplumのアーキテクチャ


Greenplumの高速性を支える大規模並列処理

もっとも単に安くDWHを使えるだけでは競合優位という面でもあまり差別化できない。現在のDWHに求められる最も重要な要素は"スピード"だ。Greenplumはノード間でディスクを共有しない"シェアードナッシング"による大規模並列処理を採用しており、高速性という点でも大きな優位点をもつ。

仲田氏の説明をもとに、もう少しこの並列処理について詳しく見ていこう。ビッグデータ時代においては、いかに大量の外部データを速く取り込めるかがDWH差別化のカギになる。ところが従来のマスターサーバとスレーブサーバ(EMCは"セグメントサーバ"と呼ぶ)という構成の場合、セグメントサーバのデータローディングがボトルネックになりやすい。このため、高速化を図るにはマスターサーバの数を増やすという"プッシュ型"の手法が取られがちだった。

Greenplumの場合、データソースからデータを取り込む際、セグメントサーバはマスターサーバにいちいち"お伺い"を立てる必要がない。つまりセグメントサーバが独自にデータを取り込むことができる"プル型"のイメージである。これは、個々のセグメントサーバに実装されているパラレルデータフローエンジンにより実現している。プル型方式であればアーキテクチャ的なボトルネックが生じにくく、仲田氏によれば「フルラックで1時間に10テラバイトのデータ処理が可能」だという。まさしくリニアなローディングがここに実現するというわけだ。

Greenplumでは、各セグメントサーバに「パラレルデータフローエンジン」が実装されており、
クエリやデータの実行に関してマスターサーバに依存する必要がない。
高速データローディングはこのエンジンによって実現されている部分が大きい

この並列処理の仕組みは、1億件を超えるような大量のデータソートを複雑なSQL文で行うような場合に威力を発揮する。アプリケーションからソート要求が来た場合、セグメントサーバは自分のストレージに格納されているデータのソートを開始する。もし、各セグメントサーバが個々にソート作業を完了させてから、マスターサーバに結果を戻し、それからマスターサーバがソート結果のマージを行い、アプリケーションに返す…というプロセスではパイプラインが途切れることになってしまう。そこでGreenplumの場合、アプリケーションの要求にあったソート結果があればセグメントサーバは随時それをマスターサーバに戻し、マスターサーバは各セグメントサーバから集まったデータを使ってソートを行い、アプリケーションに返す。この方式だとパイプラインが途切れることなくインコアで処理を行うことができ、大幅な高速化を図ることが可能になる。

次のページ
GreenplumはDWHのみ、OLTPならRDBMSで

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
DB Press連載記事一覧

もっと読む

この記事の著者

五味明子(ゴミ アキコ)

IT系出版社で編集者としてキャリアを積んだのち、2011年からフリーランスライターとして活動中。フィールドワークはオープンソース、クラウドコンピューティング、データアナリティクスなどエンタープライズITが中心で海外カンファレンスの取材が多い。
Twitter(@g3akk)や自身のブログでITニュース...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/3181 2012/02/10 17:16

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング