「3つのD」が示すAIの最新トレンド
講演の冒頭でアイディーン氏は「今、AIは複雑なものになってきたと同時に、とても面白い段階にある」と語った。同氏は講演の中で10のトレンドを取り上げ、それぞれを「Democratized:民主化」「Dynamic:ダイナミズム」「Data-Centric:データ中心」の3つのDで整理した(図1)。
1つ目のDは、データサイエンスや機械学習を組織の中のあらゆる人たちが使えるようにする「民主化」である。ややもすれば、機械学習モデルのライフサイクルにおける大半の仕事が、データサイエンティストだけが担うものと捉えられてきた。ほとんどの社員にとって、データサイエンスは敷居の高い存在であり、専門家に任せた方が合理的と思える場面も多かったことだろう。しかし、データサイエンティストのリソースは貴重だ。彼らも最も得意とするモデル構築に集中したいと考えているはずだ。その意味で、データ収集からモデル構築、展開、運用、ビジネス価値の測定、評価に至るAIエンジニアリングプロセスに、ビジネスユーザーの積極的な関与が不可欠になってきた。ここに民主化が必要とされる理由がある。
2つ目のDが「動的」であること。これは昨今のビジネス環境の変化に関係している。柔軟性と言い換えてもいいかもしれない。環境変化に対して、受け身ではなく能動的に対応できる組織スキルの獲得が重要になってきたのだ。そして最後3つ目のDが「データ中心」である。アイディーン氏が「最もホットな領域」と語るこの分野は、データマネジメントの対象にAIの学習データを組み込むことを意味する。「今までのモデル構築では、どちらかと言えば、モデルを作った後にデータマネジメントを考えるところがあった」とアイディーン氏は指摘する。データサイエンティストもデータのことを考える余裕がなかったのかもしれない。だが、データマネジメントが後手に回ると、モデルの品質やその後のアプリケーション展開に大きな問題が生じてしまう(図2)。これを避けるには、初期の段階からデータマネジメントを意識することだ。アイディーン氏の訴えるデータ中心になることで、企業はより一貫性があり、信頼性の高いモデル活用が可能になる。
AIプロジェクトをどこまで組織に定着させられるか、民主化を促すトレンド
ここからは、「民主化」「動的」「データ中心」それぞれでアイディーン氏が紹介したトレンドと企業にもたらすインパクトを見ていく。民主化に関してのトレンドは以下の3つである。
1. AIエンジニアリングと新しい役割
AIエンジニアリングの分野では、一般的に連想する「モデルエンジニアリング」以外でも、「データマネジメント」「モデル活用(システム開発)」に特化した新しい役割の必要性が認識されるようになってきた。ポイントは、データサイエンティストが全てを担うのではなく、それぞれの専門性を活かす形で複数のチームが連携し、ビジネスへの展開からモニタリングまでのオペレーションを確立することだ。それが実現すれば、企業内のAIエンジニアリングプロセスを合理的なものにできる。
2.モデルのレシピあるいはブループリント
モデルのレシピあるいはブループリントとは、Out-of-Box(すぐに使える状態)で提供される短いコードのことである。モデル構築をゼロから始めなくてもよい。これらを使えば、開発者はアプリケーションにすぐに組み込むことができるし、モデルの再利用も進む。エンジニアリング工数を短縮でき、かつデータサイエンティストでなくても使える。ベンダーが提供しているソリューションのギャップを埋めることにも役立つであろう。
3. 責任あるAIツール
積極的にAIエンジニアリングに取り組む企業が増える一方で、結果に対する説明が明確にできるか、プライバシーへの配慮をどうするかなど、「責任」についての問題がこれまでも頻繁に俎上に上がっていた。アルゴリズムの偏りやガバナンスの欠如は、AI活用が進めば進むほど大きな問題になる。企業が必要としているのは、AIエンジニアリングプロセスの中で説明責任を確立することだ。テクノロジーベンダーは、自社のツールに起こりうる問題を軽減する手段を実装しようと急いでいる。