
生成AIの本格活用が「データプラットフォーム」の在り方を問い直している。BIや機械学習(ML)で利用するための構造化データだけではなく、非構造化/半構造化データを含めて、いかにリアルタイムかつ安全に活用できるか。AIモデルの開発環境を含めて、求められる要件が変わってきた。こうした中、存在感を強めているのがビッグデータ時代からHadoopを核として製品展開してきたClouderaだ。同社への取材から、エンタープライズITが直面する、データプラットフォームの論点を整理する。
AI時代の到来により、主要プレーヤーのポジショニングは変わるか
2010年代以降のデータプラットフォーム市場は、SaaS(Software as a Service)モデルが牽引してきた。Google BigQueryやAmazon Redshiftはもちろん、SnowflakeやDatabricksに代表されるプレーヤーは、コンピュートとストレージを独立させたアーキテクチャにより、DWHが抱えていたスケーラビリティや処理性能の課題を解消。その導入の容易さからも、爆発的に浸透している。優れたUI/UXはもちろん、IT部門を介さずともビジネス部門が迅速にデータ活用を始められる俊敏性は、多くの企業から支持され、PaaS(Platform as a Service)市場のスタンダードを形成したといっても過言ではない。
これに対して、異なる戦略的ポジショニングをとってきたのがClouderaだ。同社は、オープンソースの分散処理技術である「Hadoop」の商用向けベンダーとして起業され、同じエコシステムにいたHortonworks社と2019年に合併している。Hadoopの特徴でもあるHDFS(分散ファイルシステム)とMapReduce(分散処理エンジン)を中核に、非構造化データを扱えるという強みを当時から有していた先駆者的な立ち位置にあるベンダーだ。市場でSQLのニーズが高まるとHive、Impalaを提供するなど、多様なワークロードに対応するための統合基盤を志向してきたとも言える。
「非構造化データも含めて一元管理するデータレイクに、SQL分析機能を統合した『データレイクハウス』は、Clouderaが創業から追求してきたアーキテクチャでもある」と語るのは、Clouderaの日本法人でソリューションズ エンジニアリング マネージャーを務める吉田栄信氏。同社は、こうした設計思想に基づいたデータとAIのプラットフォーム「Cloudera」を提供しており、その特徴は、常にデータが顧客企業内に留まる点にあるという。実際に日本でも、金融や製薬、製造、通信といった、厳格なセキュリティとガバナンスを最優先する企業の強い支持を集めてきた。

その一方、前述したような市場競争下においては、結果として競合他社に水をあけられた部分も少なくない。オンプレミス環境のニーズを満たしながらも、ハイブリッドクラウド環境の急速なニーズの高まりには、競合他社とは異なるアプローチを選択してきた戦略的な背景もあるだろう。Hortonworks社との合併後には、PaaSとしての製品展開を推し進め、市場での存在感を高めることにも取り組んできた。そして今、ターニングポイントを迎えようとしている。グローバル規模で地政学リスクが高まったことにより「データ主権」の重要性が訴えられると、生成AIの登場により“AI時代”が幕を開けた。Clouderaがとってきた戦略が、新たな文脈で評価される局面を迎えている。
この記事は参考になりましたか?
- DB Press連載記事一覧
-
- AIはデータ基盤の選定基準を変えるか? 市場ニーズの変化、高まるClouderaの存在感
- 分社化から10年目を迎えたHPE──現地イベントで見えた変化、AI時代のインフラ戦略を明確...
- なぜカプコンは超人気ゲームにTiDBを選んだのか?モンスターハンターワイルズを支えるDB基...
- この記事の著者
-
岡本 拓也(編集部)(オカモト タクヤ)
1993年福岡県生まれ。京都外国語大学イタリア語学科卒業。ニュースサイトの編集、システム開発、ライターなどを経験し、2020年株式会社翔泳社に入社。ITリーダー向け専門メディア『EnterpriseZine』の編集・企画・運営に携わる。2023年4月、EnterpriseZine編集長就任。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア