IoT時代の分析基盤とは?
クラウディアンは日本生まれでシリコンバレーに本社がある会社で、現在グローバルに展開を進めており、75人の経験豊富な人材が集結している。その中で佐藤剛宣氏は、障害がおこる前に対処するアクティブな製品サポートを実現するため、Hadoop/Sparkに加え、Deep LearningやHTMなどを使い研究、調査を行っている。
クラウディアンはAmazon S3互換のオブジェクトストレージ「CLOUDIAN HyperStore」をソフトウェアとアプライアンスの両方で提供している。この製品を使うことで、広く公開されているAmazon S3のAPIに準拠した、コスト効率の高いオブジェクトストレージをオンプレミスやプライベートクラウドにおいても利用できるようになる。米国では“S3 YOUR DATACENTER GUARANTEE”という、業界初のS3互換性保証キャンペーンを実施しているほど、高い互換性をウリにしている。
この製品を採用するパブリッククラウドサービスの事例としては、ニフティ クラウドストレージ、NTTコミュニケーションズのBizホスティング Cloudn Object Storageなどがある。また、直接S3のAPIをエンドユーザーに公開していないが、内部で活用されている事例としては、NTT東日本の「フレッツ・あずけ~る」や石川コンピュータセンターの「BCPリモートバックアップサービス」などがある。
クラウディアン自身でもCLOUDIAN HyperStoreを利用して「スマートサポート」を提供している。これは顧客の大量のログデータを自動的に収集分析し、顧客の運用効率を飛躍的に向上させるというものだ。
佐藤氏は、IoT時代の分析基盤には、二つのトレンドがあると思っている。まず自動車やビデオなどによるIoTクライアントのビッグクライアント化がある。そのため、より近いデータセンターにデータをアップロードしたいというニーズにより分析クラスタの広域分散化が、今後ますます求められるようになる。
広域分散の事例としては、欧州の大手クラウドサービスプロバイダが、CLOUDIAN HyperStoreを採用し、世界14データセンターに“〜10ペタバイト”のデータを分散配置している事例等がある。国内の事例では、大阪大学が中心となって、日米11拠点を相互接続し、災害復旧対策を検証しているプロジェクトがある。
クラウディアンが行っているビデオ分析のパイロットプロジェクトでは、デジタルサイネージに取り付けられたカメラを使い、Deep Leaningにより物体認識と分類を行っている。たとえば東京で得られた映像データは近くのCLOUDIAN HyperStore にアップロードされる。ビッグクライアント化と広域分散が同時に進行している。
これらの事例などを捉え、佐藤氏は「IoTが普及すると、世界中にビッグデータが分散する」と見ている。ただ、ビッグデータの移動はネットワークボトルネックのため、事実上不可能だ。そこで、ローカルストレージ上での解析処理をしながらも、ひとつのクラスタを構成することが求められる。
IoT時代の分析基盤の課題と、それに対応するクラウディアンの製品は以下となる。