SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine Day 2022

2022年6月28日(火)13:10

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

週刊DBオンライン 谷川耕一

アジャイルなデータ管理でエンタープライズ・データ・ハブを目指せ

 ビッグデータという言葉が登場して間もなく、注目を浴びたのがHadoopだろう。一時期は「ビッグデータ=Hadoop」で、ビッグデータを活用したければ「Hadoopでなければだめ」くらいな勢いもあった。そんなブーム的な時期を越え、ここ最近はHadoopを企業なりが実際に活用するには具体的にどうすればいいかを考えるようになっている。

Impalaの登場がHadoopの転機に

Cloudera チーフ・オペレーティング・オフィサー カーク・ダン氏
Cloudera チーフ・オペレーティング・オフィサー
カーク・ダン氏

 そんなHadoopの企業向けディストリビューションを提供しているClouderaのチーフ・オペレーティング・オフィサー カーク・ダン氏は「我々はHadoopを6年前に商業化しました。従来のデータ管理技術にはビッグデータを扱うには遅くて高いという問題がありました。大規模なデータの管理を低コストで行う。そのためには新しい技術を発明する必要があったのです」と語る。Hadoopが登場する以前はデータベースが遅くて高いがために、一部のデータを抽出しサマライズした結果のデータしか扱えなかった。それがHadoopの登場で「完璧なデータ」を扱えるようになり、企業にとって新たなチャンスをもたらしているというのだ。

 とはいえビッグデータ活用におけるHadoopは、蓄積したデータの「バッチ処理的なもの」が得意。それを低コストで高速に行えるのがこれまでの評価ポイントだっただろう。そんなHadoopの状況を変化させるきっかけとなったのがImpalaの登場だと言うのは、Clouderaのチーフ・テクノロジストのイーライ・コリンズ氏だ。Impalaは、MapReduceではなくSQLを使ってHadoopにアクセスするテクノロジー。しかし、それだけではない。

 「Hadoopのビッグデータに対し、低レイテンシーでのアクセスを可能にしました。これによりアドホックな分析をビッグデータに行えるようになり、洞察を得る時間の短縮が実現しました」(コリンズ氏)

 バッチ処理での利用ではHadoopは舞台裏にいる。Impalaの登場で表舞台に上がり、Hadoopはユーザーが直接利用するものになったのだ。とはいえ、Hadoopだけでビッグデータのすべてを賄えるものでもない。MongoDBのような新しいNoSQLもあれば、旧来のリレーショナル・データベース、さらにはその改良型とも言えるカラム指向のデータベースもある。そういう状況の中で、ClouderaとしてはHadoopをエンタープライズ・データ・ハブとして利用するとコリンズ氏は主張する。

 「Hadoopとそれ以外のデータベースを使って、1カ所で分析ができるようにします。それで一貫していて統一された分析が可能になります」(コリンズ氏)

 こういった分析環境のことをデータレイクなどとも呼ぶ。たしかにこれが実現できれば、企業のデータ分析に関する問題の多くが解決できるだろう。しかし、エンタープライズ・データ・ハブという考え方は「理想論」であり実現は簡単ではないのではとも思うところ。

チーフ・テクノロジスト イーライ・コリンズ氏
チーフ・テクノロジスト
イーライ・コリンズ氏

 「データウェアハウスがリレーショナル・データベースを使うための方法論であるように、エンタープライズ・データ・ハブはHadoopを使うための方法論の1つです。一気に構築する必要はなく、段階的にエンタープライズ・データ・ハブの環境を構築すればいい。最初は1つのデータソースでもよく、それに徐々に追加すればいい」(コリンズ)

次のページ
アジャイルなデータ管理

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
週刊DBオンライン 谷川耕一連載記事一覧

もっと読む

この記事の著者

谷川 耕一(タニカワ コウイチ)

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/6366 2014/11/26 00:00

Job Board

PR

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

2022年6月28日(火)13:10

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング