“無茶なプラン”を成功に導いた内部リソースの有効活用
講演時点(2024年11月)では「12月に予定している非構造化データも含めたデータの本番移行を待っている状態」(ナラキ氏)とのことだが、既にいくつかの生成AIプロジェクトもMDP上でスタートしており、要件定義から約1年という短い期間内で効率的に各工程のプロセスを完了し、新しいプロジェクトをスタートさせていることに驚く向きも多いだろう。
また、プロジェクトをベンダー任せにせず、アーキテクチャの実装という重要なプロセスをほぼ内部リソースでやり遂げている点も評価に値する。ルネサスのデータ基盤刷新プロジェクトはどのようにして成功に近づいていったのか。ナラキ氏は3つのサクセスポイントを挙げている。
1つ目は従業員の教育である。「データとAIが使える環境があるだけでは不十分。そのソリューションを使えるようにするためには従業員の教育が必要」(ナラキ氏)という信念のもと、まず従業員が共通で使えるワークスペースを用意し、さらに全社で共有して使えるデータを格納するスペース、各ビジネス部門が作成したデータを格納できるスペースも準備、その上で「これらの環境をどう使っていくのかという教育を実施した」(ナラキ氏)という。
2つ目は教育の内容をDatabricksプラットフォームの4つの機能──Playground、SQLエディタとAIアシスタント、AI/BIダッシュボード(従来のBI機能も含むAI搭載のローコードダッシュボード)、AI/BI Genie(人間のフィードバックにもとづいて継続的に学習するチャットライクな会話インタフェース)──にフォーカスしたことだ。ビジネスユーザーがDatabricksプラットフォームのすべての機能を使いこなせる必要はなく、業務の遂行に必要なスキルが身についていればいい。そのスキルとして4つの機能を選定し、それらのトレーニングにフォーカスしたことでビジネスユーザーにとっても新しいデータ基盤(MDP)が使いやすくなり、データとAIの民主化を拡げることにつながっている。
そして3つ目が「シャドーITに市民権を与える」というユニークな施策である。ビジネスユーザーがIT部門の許可なく独自にソフトウェアやサービスを導入するシャドーITの存在に頭を悩ませているIT部門も少なくないが、ルネサスでは新データ基盤の活用にあたり「シャドーITの存在は認める、ただし個別のワークスペースを用意し、IT部門の管理下で提供する」というルールを設けている。もっとも、ソースデータの取り込みに関してはIT部門が一括して行い、(分析ツールなど)それ以外はシャドーITの利用を許可し、共存を可能にしている。シャドーITの根絶を図るのではなく、全社共通のルールのもとで共存を可能にするというアプローチもまた興味深い。
一方でMDPプロジェクト終了後の振り返りとして、ナラキ氏は以下の3つの反省点も挙げている。
- セキュリティ:実装で躓いたのが(VPC内の)プライベートエンドポイント(もっと深く理解して設計すべきだった)
- データの取り込み:Databricksの「CDC(Change Data Capture: 複数のデータソースにおける変更をデータウェアハウス上のテーブルにマージする機能)」は魅力的な技術だが、導入にあたっては様々な調整(ソースシステムの調整、インフラの強力など)が必要(思った以上に大変だった)
- コスト管理:Databricks内部だけでなく、トータルでどのコストを管理すべきなのか、タグ付け(tagging)を活用して検討したうえでコスト管理機能を構築すべき(あとで作り直すのが大変だった)
いずれもモダンな大規模データプロジェクトを身を以て経験した側ならではのリアリティあるコメントである。