データサイエンティストが必要なのではなく、データを分析した結果の知見を活用したい
データサイエンティストへの注目が少し逸れているのには、2つの理由がありそうだ。1つが、優秀なデータサイエンティストはそう簡単に増えない、育成できないことだろう。ビジネスに価値ある知見を導き出すには、数学や統計学などの高度なデータ分析スキルと同時に、ビジネス目線で価値あるデータを見つけ出しそれを読み解くビジネスセンスが必要だ。
どちらかを持っていても、両方を併せ持つ人は少ない。さらに得られた知見をビジネス現場の人に分かりやすく伝えるのも簡単ではない。なので容易にはデータサイエンティストと呼べる人は増えない。そのためもあってか、データサイエンティスト育成プログラムなども少し足踏み状態なのかもしれない。
もう1つの理由が、データサイエンティストが必ずしもいなくてもビッグデータを分析し結果をビジネスに生かす流れが生み出せることだ。これは、ビッグデータを分析し活用するためのさまざまな仕組みが充実してきたことが背景にある。たとえば、機械学習などの仕組みを簡単に利用できるクラウドサービスが登場しており、関連性のある事象を見つけ出すなんてことが、統計学の高度な知識がなくても容易に行える環境が整いつつある。
そんなデータサイエンティストでなくてもデータを活用するためのツールを提供しているベンダーの1つが、データサイエンスの専門ベンダーであるデータビークルだ。同社は、データサイエンス専用のデータ変換ツール「Data Ferry」の発売を発表した。
「データビークルは、企業に残る価値は最後はデータにしかないと考え起業しました」と言うのはデータビークル 代表取締役社長の油野達也氏だ。2014年12月に創業し1年が経過、2015年4月に提供を開始した「Data Diver」は、クラウドのレギュラー契約が2社、有償トライアルが6社で現在は8社が利用している。Data Diverは仮説に対し、影響する要因を解析し「自然言語」の文章やグラフなどでユーザーに分かりやすく提示してくれる。
今回発表したData Ferryは、さまざまなデータソースとData Diverなどの分析環境を連携するためのツールだ。これはData Diverの発表時にはすでに、提供を表明していたツールだ。世の中にはデータ連携を行うETLツールなどは数多くある。とはいえ「データサイエンスのためには専用機が必要です」と油野氏。たんにデータを変換してシステム間で受け渡すだけでなく、分析するのに必要なあらゆる機能を持った変換ツールを作ったとのことだ。
そして今回、このデータサイエンスのための専用機となるData Ferryを開発するにあたり、データを収集するエンジン部分は独自開発するよりも既存の実績ある技術を選ぶことに。結果として選んだのがアプレッソの「DataSpider」だった。選んだ理由は分析のための高度な改造要求に応えられること、提供する会社に共に戦える柔軟なエンジニアリングがあること、さらに海外での実績があることだったと油野氏は語る。
油野氏が示した協業の3条件について、株式会社アプレッソの代表取締役社長でありセゾン情報システムズの取締役CTOでもある小野和俊氏は「アプレッソはJavaのスペシャリストが集まっている会社です。プロダクト・ビジネスにフォーカスしており、その15年間の技術の蓄積が今回の改造要求や性能要求に応えられたと考えています」と語る。
アプレッソではたんにシステム間でデータ連携させるだけでなく、流通するビッグデータを扱う上で求められる大容量データの高速処理部分を独自開発しているところに強みがあると言う。また、ビジネスで戦略的な話や重要な案件が出てきた際に、それに素早く柔軟に対応できる社内体制があるのも優位性だと言う。
「Googleが実施しているような、開発エンジニアの20%ルール(エンジニアの仕事時間の20%を、与えられた仕事以外の好きなプロジェクトのために使えるルール)のようなことを社内でも実施しています。またエンジニアの開発生産性を最大化するための投資も積極的に行っています。今回のようなわくわくするような提案にも、すぐに対応できるようにしています」(小野氏)
グローバルで実績がある点も、セゾン情報システムズが扱っている「HULFT」とDataSpiderは、すでに世界42カ国で利用されており、サポートも日本語、英語、中国語で24時間体制で対応している。「売るだけでなくサポートし、作ることをグローバルに展開しています」と小野氏は自信をみせる。