ビッグデータを「ストック型」にて活用される4つの事例
前回では、ビッグデータビジネスの効能は、「フィードバックのあり方が、ストック型であるか、フロー型であるか」および「フィードバック先が個別であるか系全体であるか」という2軸により整理されることを示した。今回は特に「ストック型」にて活用される主な事例を4つ紹介したい。
第1の事例は、Googleが大量の音声データを収集することにより、音声認識アルゴリズムの改善を行った事例である。データの収集方法が「GOOG-411と呼ばれる新サービスの提供による」という点が興味深い。
第2の事例は、ビッグデータを保持はするものの十分な活用ができていないと感じる事業者が、外部の知見を導入することによってその活用改善に至った事例である。米国のオンラインDVDレンタル事業者Netflixの事例と、「データ予測コンテストの開催」自体を本業とする米国Kaggle社の事例を紹介する。
第3の事例は、ビッグデータ活用の雄であるAmazon.com社が、ECサイト以外においても大量のデータを収集し、新たなる活用につなげようとしている事例としてAmazon Popular Highlightsの事例を紹介する。
以上の各事例は、アルゴリズムの改善を中心とした「フィードバック先が系全体」の事例となるが、第4の事例においては「フィードバック先が個別」である事例として、韓国健康保険審査評価院(HIRA)が薬禍への対応を迅速に実現した事例を紹介する。
アルゴリズムを賢くするためのトレーニングデータを収集―GOOG-411のケース
短期的な収益に執着せず、まずは大量のデータを収集すること自体に注目した事例としてGoogle社が提供していた「GOOG-411」の事例を紹介する。
GOOG-411は、日本で言う番号案内サービス(104サービス)に相当する(図1)。それを人が応対するのではなく、機械的に実行していたものである。これはネットサービスの利用を伴わず、音声通話だけで完結するサービスであったため、Googleの最も基本的な収益形態である「検索と広告」に帰結させることが困難であった。
提示する情報の序列に手心を加えることによって収益を得ることも想定できるが、これはGoogleの基本的な発想と相反するところであるため、少なくとも同社が提供している限りにおいては、想定しにくいビジネスモデルである。
以上のような点から、どのような収益構造を作り上げているかが、サービス開始当初は良くわからなかった。結局のところ、Googleは電話を介して番号を問い合わせに来た人の音素データを集め、音声認識のアルゴリズムをより賢くしようというのが本サービスの趣旨であったとしており、本サービスについて単体としての収益性を見込んでいなかった。これは端的には、「金ではなく、(アルゴリズムを賢くするための)トレーニングデータ」が目的のサービスであったと言える。
本来、アルゴリズムを賢くするためのトレーニングデータを収集するために多くの費用と手間を要する。例えば、音声認識に関する研究であれば、アルバイトを集めて一日中、特定のテキストを読ませる、などといった活動も行われてきたが、より効率的に大量かつ多様なトレーニングデータを収集しているものである。
通常、サービスの開発においては、「これやってどのくらい儲かるの?」という点は最も重要な事項となる。事業部門はもちろん、最近では研究開発部門においてもそのプレッシャーから無縁ではない。つまり、「付加価値と対価の交換が成立するか(ビジネスモデルとして成立しているのか?)」という議論である。しかし、上のモデルはこのビジネスモデルを短期的には無視し、「研究開発モデル」とでもいうべきモデルを採用していると言える。サービスをよりよくするためのデータを収集することができるのであれば、それで十分とするような発想をするものが登場しつつある、ということを意識する必要があるだろう。
当然、いつまでも研究開発モデルを洗練させているだけでは、民間事業者として成立しないところであり、いつかはビジネスモデルに帰着させる必要がある。上のGOOG-411のケースでは、スマートフォンにおける音声認識インターフェイスとして適用することによって、同社が得意とする広告型ビジネスモデルに帰着させたと推察される。
収益には直結しないけれども、サービスの魅力向上に資しているケースは多い。ビッグデータビジネスにおいて、収益が不要であるということはまったくもってなく、最終的には収益化することは極めて重要である。しかし、すぐに収益に直結するわけではないような形でビッグデータを用いているケースは多い。(次ページへ続く)