SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

日立のデータベース

ひたちはじめて物語―ストリームデータ処理の巻

本連載ではこれまで、日立が扱うさまざまなデータベース技術の中でも、特にリレーショナルデータベースやら高速データアクセス基盤やら、まあ言ってみればデータベースの王道的なものを中心に紹介してきた。しかし今回はちょっと目先を変えて、近未来の技術を紹介してみたいと思う。現在、日立をはじめ、世界中のITベンダーや研究機関が取り組んでいる先端データ処理技術、「ストリーム」だ。

 「ああ、動画のストリーム配信ね。いやー、こないだなんて、ついつい徹夜でガンダム全話見ちゃって、次の日午前半休しちゃったよ、アハハ」

 ……喝っ!!!! DB Onlineの読者たるもの、そんなことではいけません! いや、徹夜で動画見まくって午前半休というのは、まったくもって問題ない(注:あくまでも筆者の個人的価値観に基づく)。しかし、データベース技術者たるもの、「ストリーム」といえば動画配信ではなく、むしろあっちの方のストリームをとっさに連想してほしいのです。そう、「あっち」といえば、あっちですよ、最近ビッグデータ周りで話題になってる、あっちの方のストリームですよ……。

ストリームデータ処理ってそもそも何ができるものなの?

 というわけで今回は、現在日立が取り組んでいるストリーム、正確に言うと「ストリームデータ処理技術」について、同社の専門家の人たちにあれやこれや聞いてみた。

 正直に言うと、筆者自身も偉そうなことを言っておきながら、ストリームデータ処理なるものが一体全体何なのか、実はよく分かっていない。ただ、最近何となく、ビッグデータ絡みでよくストリームという用語を耳にするようになってきて、「ああ、センサーのデータとかをリアルタイムで処理するあれね。ビッグデータで、速くて、凄くて、で、モニョモニョモニョ……」。要は、何となく知ったつもりでいるが、実のところはほとんど分かってないというやつだ。

 でも、「高速」「リアルタイム」といったキーワードは、そう的外れでもないと思ってるんですが、どうなんでしょ?

田村さん
ストリームデータ処理について、
すごくわかりやすく説明してくれる!田村さん

 
 「リレーショナルデータベースに代表される従来のデータ処理は、データをいったん溜め込んだ後に、じっくり時間をかけて分析していました。しかしストリームデータ処理はデータを溜め込むことなく、データが発生している“その場”で即座に分析して、何らかの意味のあるイベントをリアルタイムに発生させるという技術です。つまり、過去に起きたことをじっくり細かく分析するのではなく、『今起きていることを、なるべく早く知りたい』というニーズに応えるためのものですね」

 こう説明してくれたのは、日立でストリームデータ処理基盤のソリューションに携わる、ソフトウェア開発本部 第2基盤ソフト設計部 主任技師の田村和則さん。

 なるほど、やはり「高速」「リアルタイム」というのは、あながち的外れではなかったみたい。「何らかの意味のあるイベントを発生させる」という部分は何だかよく分からないけど、まあいいや。ストリームデータ処理、大体分かっちゃいましたよ、はい。

 とここで、田村さんと同じ部署で、同じくストリームデータ処理のソリューションを担当する横山高広さんがポツリ、

横山さん
時々刻々、時系列データについて、
説明してれる横山さん

  「お客さまのところに製品や事例の説明に行くと、既存のデータベースシステムをストリームに置き換えて高速化するというイメージを持たれる方が多いのですが、実はそうではないんですよね」

 ドキッ! そう思ってたんだけど……だって、要はこれまでのデータベースより速いから、リアルタイムで処理できるようになったっていうことなんじゃないの?

 「そうではなくて、時々刻々と変わっていくデータ、つまり『時系列データ』を対象に分析をかけるために使われるものなんです」

 時々刻々! 「時のな~が~れ~に身を任せ~」。テレサテンの歌声が脳内に流れた次の瞬間、NHKの「時事公論」のTV画面がフラッシュバックし、あやうく昏倒するところでむくりと起き上がり、ええと、ええと何の話でしたっけ?何だか途端に分からなくなってきたぞ。「時々刻々」やら「時系列データ」とやらは、一体何?

 「従来のデータ処理は、ある瞬間のデータ、つまり“点のデータ”を対象にしていました。例えば、『人や車がある瞬間にこの場所にいた』といった情報です。でもストリームデータ処理の世界では、こういう“点のデータ”は意味を持たないんです。そうではなくて、ある一定の時間枠の中で取得した“データの集合”に対して分析をかけ、点ではなく“軌跡”を見るのです。例えば、『人や車がその間にどこからどこへ移動したのか』といった情報ですね」(田村さん)

 ああ、なるほど。時系列って、そういう意味なんですね。

 「確かにストリームデータ技術では、インメモリ処理をはじめとした、高速処理のための個々の要素技術が注目されがちです。しかし実は一番のポイントは、こういう『時系列での分析』ができるところにあるんです。点ではなく軌跡の情報を抽出して、それをイベントという形で上位に通知することで、データの中からこれまでにない新たな意味合いや価値を引き出せるようになります」(田村さん)

 そうか、さっきの「何らかの意味のあるイベントを発生させる」というのは、そういうことだったのか。

次のページ
「ん? 何だか普段と違う動きしてるみたいだぞ……」

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
日立のデータベース連載記事一覧

もっと読む

この記事の著者

吉村 哲樹(ヨシムラ テツキ)

早稲田大学政治経済学部卒業後、メーカー系システムインテグレーターにてソフトウェア開発に従事。その後、外資系ソフトウェアベンダーでコンサルタント、IT系Webメディアで編集者を務めた後、現在はフリーライターとして活動中。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/4928 2013/06/27 09:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング