データブリックス・ジャパンは5月22日、事業戦略説明会を開催した。
同社はデータウェアハウスとデータレイクを組み合わせた「レイクハウス」を提唱し始めた企業で知られる。代表取締役社長の笹俊文氏は、「(同社のプラットフォームは)半構造化のログから、構造化データとしてのテキスト、さらには非構造化の音声・動画・画像をまとめて扱うことができる」と強調した。
同社は、レイクハウスに生成AIの機能を盛り込んだものとして、「データ・インテリジェンス・プラットフォーム」をグローバルで提供している。大きな違いは「データ・インテリジェンス・エンジン」が組み込まれたことだという。従来、SQLのコマンドを打つ必要があったが、自然言語で欲しいデータをリクエストすれば、自動的にSQLが生成される機能などを搭載。笹氏は「お客様から、データの民主化を図っていきたいという声が寄せられるときに、SQLのコマンドが分からないユーザーでもデータがとれる機能を作ってくれないかという要望が多かった」と振り返り、それらに応えることができるものであるとした。
こうしたデータの民主化を進めるときには、ルール作りもポイントになる。「Unity Catalog」では、データの中身を生成AIが解析し、タグ付けする機能を盛り込んだという。
また、同社は3月にオープンソースの汎用LLM「DBRX」を発表しているが、6月からはLLMの学習を効率よく行うソフトウェアスタックとして「Mosaic AI トレーニング」を提供開始することを発表した。笹氏は「独自の生成AIモデルを作るとき、大量のGPUを必要とするが、GPUは高価なままだ。効率よくGPUを使うことが求められる。オーケストレーションから分散トレーニングが得意なのがMosaic AI トレーニングだ」と話す。
最後に、日本法人における2023年度の振り返りをした。笹氏によると、同社の事業成長率は前年比100%以上で、顧客数、パートナー企業数ともに前年比2倍以上となり、記録的な年だったという。イオン、全日本空輸(ANA)、ブリヂストン、コスモエネルギーホールディングス、コニカミノルタなどが、新たにデータ・インテリジェンス・プラットフォームを採用したことを明らかにした。
【関連記事】
・データブリックス、「Lakehouse AI」「LakehouseIQ」発表 生成AI活用を加速
・データブリックス、MosaicMLを買収へ 生成AIモデル構築などを支援
・データブリックス、商用利用が可能な生成AIモデル「Dolly 2.0」の提供を開始