「データとAIの民主化を推進する」
ここであらためてDatabricksが提唱するData + AI基盤、すなわちレイクハウスプラットフォームを簡単に説明しておきます。レイクハウスプラットフォームとは、データウェアハウス(DWH)とデータレイクを統合して扱うことを目的にしたデータ活用のためのアーキテクチャであり、同社が2020年に提唱した概念がベースです。
「これからの時代の勝者は、自社独自のData + AI基盤を構築・運用する『Data Forward』企業である」──基調講演の冒頭、データブリックス・ジャパン 代表取締役社長 笹俊文氏はこう述べました。2023年のIT業界は「ChatGPT」に代表される生成AI関連のニュースで埋め尽くされた感がありますが、日本でも既に多くの企業が生成AIをビジネスに取り込む動きを見せています。ただ、ChatGPTなどサードパーティの大規模言語モデル(LLM)をエンタープライズ企業がそのまま活用するには、セキュリティやガバナンスなど多くの課題があります。最近では独自LLMを構築する重要性も叫ばれています。
しかし、企業が独自LLMを構築するハードルは非常に高く、それ以前の問題として、データ基盤やAI基盤の構築には高価で複雑なコンポーネントが必要になることが一般的でした。DatabricksはこうしたData + AIにまつわるハードルをなくし、「スマホライクな次世代データ基盤としてレイクハウスプラットフォームを普及させ、データとAIの民主化を推進する」(笹氏)ことを戦略として掲げています。
今回は、Databricksのソリューションで「データの民主化」「AIの民主化」「人材育成」という3つのテーマに挑戦する3社の事例を紹介します。