AmazonからClouderaへ、Clouderaに惹かれた理由とは
──Amazonにて、AIのプロジェクトを率いた経歴をもっていると伺っています。ClouderaのCPO(最高製品責任者)を引き受けた理由をお聞かせください。
Clouderaには約10ヵ月前に加わっており、以前はAmazonでAlexaチームを率いていました。
Amazonでの仕事に満足していましたが、Cloudera CEOのチャールズ(Charles Sansbury:チャールズ・サンズベリー)から「おもしろい会社に入ったから一緒にやろう」と誘われたのです。実は同時期にSnowflakeやDatabricksからも声をかけてもらっており、この分野を調べてみたところ、Clouderaに最も魅力を感じたため入社を決めました。
私は、AWSがまだベータ版として提供されていた時代からクラウドを使っており、AIには12年以上前から関わっています。Amazon Alexaの前には、脅威や異常検出などでもAIを利用してきました。また、オープンソースビジネスにも関わっており、NSA(米国家安全保障局)がオープンソースソフトウェア(OSS)として公開した「Apache NiFi」「Apache Accumulo」にも携わっています。
そして、ClouderaにはOSSの要素があり、「データ」「AI」「クラウド」の3つが交わっている。つまり、私の経験や知見が活かせるということです。
SnowflakeやDatabricksはクラウドベースで、新しいイメージがあるでしょう。その点では、Clouderaの技術は“最新でクール”ではないかもしれません。しかし、基盤は堅実です。しっかりとした基盤があることが大切で、その上に(新たなアプリケーションなどを)構築すれば良いだけです。
──Clouderaに感じた魅力について、もう少し詳しく教えてください。
現在、Clouderaは「Cloudera Data Platform(CDP)」として、ハイブリッドデータプラットフォームを提供しています。この上にデータウェアハウス、データエンジニアリング用途のエンジン、機械学習のワークベンチなどが載っており、必要に応じて利用いただけます。
Clouderaは「ハイブリッド戦略」を明確に打ち出している点が特徴的です。我々は、データをオンプレミス/クラウドに置く、オンプレミス/クラウドに戻す、共存させる、という“すべての選択肢”が選べる状態をハイブリッドと呼んでいます。これは、データがあるところでの仮想化を推進するものでもあります。
言い換えるならば、目指しているのは「ホテルのコンシェルジェサービス」。チェックイン時だけでなく、その後に追加要求が出てきたときにも継続的にサポートを続ける。Clouderaにはデータをどこに置くのが最適なのか、そのための専門知識があり、すべての選択肢を提供できます。
一般的にハイパースケーラーのパブリッククラウドは、データを移すこと自体には料金がかかりません。しかし、データを外に出す際は“エグレス(Egress)”として高額な料金が必要でしょう。加えて、時間もかかってしまいます。Clouderaであれば、そのような“税”とも呼べるものから解放されます。