Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

ビッグデータ時代の到来を睨んだTeradata 14の新機能に迫る

edited by DB Online   2011/10/12 11:30

Teradataは9月、SQLデータベースソフトウェア「Teradata 14」をリリース、10月初旬に米サインディエゴで開催された同社の年次カンファレンス「PARTNERS 2011」にて披露した。本稿ではPARTNERSで関係者から直接聞いた説明やセッションでの情報をもとに、Teradata 14の新機能について解説を試みたい。

新しくなったTeradata 14の新機能

 もともとTeradataというデータベースはシェアードナッシングを採用した"Parallel Everything"な、データウェアハウジングに特化した並列処理型RDBMSである。サーバ間でリソースを共有しないため、I/Oボトルネックが発生しにくく、したがって高速なクエリ処理が可能となっている。またワークロードの緊急性や重要性に応じて、リソースを柔軟に振り分けることも可能だ。加えてペタバイト級のデータでも容易に扱えるスケーラビリティの高さも大きな特徴のひとつだ。また、あまり知られていないがIntelアーキテクチャ+SLES(SUSE Linux Enterprise Server)というオープンなプラットフォーム上で稼働するため、既存のIT環境や業務アプリケーションとの連携も容易となっている。

 新しくなったTeradata 14ではいくつもの新機能が実現されている。以下、主なポイントを挙げておく。

  •  Teradata Columnar
  •  Compress on Cold
  •  アプリケーションマイグレーション
  •  行レベルセキュリティ
  •  テンポラリ(オンデマンド)な拡張性

 このうち、オプションではあるがビッグデータ処理を見込んだ非常に画期的な機能である「Teradata Columnar(以下、Columnar)」と、データの"温度"に応じてインテリジェントな圧縮/解凍を行う「Compress on Cold」について取り上げたい。

Teradata Columnar

 Columnarは行または列ベースの高速かつ高密度なデータストレージ機能だ。各テーブルはTeradataデータベース内の行(ロー)、列(カラム)、または行と列がミックスしたフォーマットにストアされる。つまり同じデータベース内に、ハイブリッドを含む複数のタイプのテーブルを作成することができ、分析アプリケーションに応じて最適な形でデータをストアできる。行ベースのみの場合に比べて、クエリ検索のパフォーマンスとデータ圧縮が大幅に向上する点が最大の特徴だ。この"ハイブリッドカラムストレージ"を実現しているのは、現時点ではTeradataだけである(Oracleはカラム圧縮は可能だが、カラムストレージは実現していない)。

 データ圧縮には6つのアルゴリズムを採用しており、データに応じて自動で動的に選択される。

  1. ランレングス
  2. 辞書圧縮
  3. トリム(trim)
  4. デルタ圧縮(Delta on Mean)
  5. Null
  6. UTF8

  圧縮率はデータの性質に大きく依存するので一概にはいえないが、たとえばランレングス+辞書圧縮の2段階で適用することで、もとのデータ量に比べ80%以上の圧縮が可能となっている。

 Columnarはパーティショニングにハッシュではなくラウンドロビン方式を利用する。TeradataはこれをNoPI(Primary Index)と呼んでおり、アペンドオンリーとして機能を提供している。これによりストレージの自動圧縮のI/O負荷を大幅に軽減し、レスポンスタイムの劇的な向上が実現するという。

Teradata Columnarの圧縮機能は6種類のアルゴリズムから動的/自動で選択される。
とくに注目は辞書圧縮で、他のアルゴリズムと組み合わせることでさらに高密度での圧縮が可能になる
Teradata Columnarの圧縮機能は6種類のアルゴリズムから動的/自動で選択される。とくに注目は辞書圧縮で、他のアルゴリズムと組み合わせることでさらに高密度での圧縮が可能になる
NoPIにより大幅なI/Oボトルネックの軽減が実現するとされている
NoPIにより大幅なI/Oボトルネックの軽減が実現するとされている

 TeradataはColumnarの提供を2011年12月から開始するとしている。

※この続きは、会員の方のみお読みいただけます(登録無料)。


※この続きは、会員の方のみお読みいただけます(登録無料)。


著者プロフィール

  • 五味明子(ゴミ アキコ)

    IT系出版社で編集者としてキャリアを積んだのち、2011年からフリーランスライターとして活動中。フィールドワークはオープンソース、クラウドコンピューティング、データアナリティクスなどエンタープライズITが中心で海外カンファレンスの取材が多い。 Twitter(@g3akk)やFacebook(...

バックナンバー

連載:DB Press

もっと読む

All contents copyright © 2007-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5