国内企業におけるAI推進状況
日本に限らず、データ・AIの活用を推進していこうという動きは企業において大きく注目されていますが、その推進のステージは企業によってまちまちです。推進の初期段階では多くの人がまだ懐疑的で、足を踏み入れることに戸惑います。まずは1つ何かテーマを決めてPoC(Proof of Concept)をやってみようというところからスタートし、結果が良ければ少しずつその活動を広げていくというのが一般的です。
その際にはデータサイエンティスト(DS:Data Scientist)等の専門家や、デジタルトランスフォーメーション(DX:Digital Transformation)を専門にした推進部隊が組成され、データ・AI活用を加速させようとしますが、ここで人材の壁にぶつかります。既存のデータサイエンティストは数が少なく、できることには限りがあります。非データサイエンティストは技術力が低く、AI活用のプレーヤーにはなれません。
この状況を打開するために必要とされているのが、技術の民主化によりAIを扱う敷居を下げてくれるプラットフォームです。これにより、既存のデータサイエンティストも、今まではAI活用に加われなかったビジネスアナリストやエンジニアなども企業活動のAI化に加わることができます。このようにして、非データサイエンティストがデータ・AI活用に加わるようになると、会社のあらゆるところでデータドリブン、AIドリブンな課題解決が行われるようになります。このような企業は、技術導入を広範囲に実現したAIドリブン企業と呼ばれています。
「はじめに」の冒頭で触れた企業は、DataRobotの導入により、データサイエンティストチームだけにプロジェクトの集中しているステージからAI民主化のステージへと駆け上がりました(図1.1.1)。それにより、技術活用のレベルが飛躍的に高まり、高いROI(Return On Investment)を実現したのです。
データから価値創出までのステップを自動化
DataRobotは過去データから予測可能なモデルの生成を自動化する(Auto ML:Automated Machine Learning)だけでなく、入力データの準備(Data Prep:Data Preparation)や実運用化後のモデルの監視や管理(ML Ops:Machine Learning Operations)といったAI利用に必要なサイクルをエンドツーエンドで自動化するプラットフォームを提供しています(図1.1.2)。
特に、Auto MLはより精度の高いモデルを構築するためのアルゴリズムのチューニングなど、技術的難易度の高いプロセスを自動化してくれます。本書では、DataRobotのプロダクト群の中でも中核的なAuto MLを中心に取り扱います。
日本でDataRobotのAIビジネスを展開する中で気付いたことは、まず日本人は最新技術が好きだということです。多くの人が最新の技術動向を追っていて、またメディアもそれに追従するように発信しています。中には熱心に勉強をしていて、既にAI関連技術に詳しい方にも会う機会が多々あります。このような部門の方々にDataRobot(図1.1.3)のような先進的かつ誰でもすぐに使える製品を紹介すると、非常に強い興味を示されます。
「これがあればすぐにでも自社のAI活用が始められる」
「これまでデータ・AI人材獲得に頭を悩ませていたけれど、これがあれば解決できる」
一方で、好意的な反応ばかりとは限りません。特に自らPythonなどのツールを使って機械学習モデルを組んでいるようなデータサイエンティストの方からは、
「DataRobotができることは限られていて、やはり人間のデータサイエンティストにはかなわない」
「こういうことはAI技術を深く理解したデータサイエンティストが行わなくてはならない」
などのコメントが出ることもあります。
DataRobotの製品は現在データサイエンティストだけが行える仕事の多くを自動化してくれるので、このように、一部のデータサイエンティスト達には危機感や対抗意識を持たれてしまうことがあります。その裏側には、このようなツールが導入された時の自分達の役割に不安をいだいているケースもあるようです。実際のところ、このような心配には及ばないと筆者は考えています。
後述するように、現在どの企業においても扱うデータ量の増加に伴ってデータサイエンティストは圧倒的に足りていない状況が続いており、この傾向はこれからも続きます。また、AI技術応用の可能性は引き続き速いスピードで進んでおり、自動化ツールだけでは解決できない新しい課題も現れてきています。
そうした状況を踏まえると、データサイエンティストには、データサイエンティストにしかできない課題に注力して、自動化できるところは自動化する自動化ファーストな姿勢が今、求められているのではないでしょうか。
AI人材の壁は日本において特に大きな問題
このような背景もあり、数年前からAI教育の重要性が世界中で叫ばれるようになってきました。データ・AIの使い方を身に着けたデータサイエンティストは、その希少性からユニコーンとまで呼ばれる存在で、日本でも多くの企業が既存の報酬システムに例外を設けた高給待遇での採用を加速しています。特に日本においての取り組みは、アメリカよりも2つの点で難易度が高くなっています。
1つ目は技術人材の分布が圧倒的にITサービス企業(SIやコンサルティング)に偏っているということです。10年前の調査になりますが、図1.1.4に各国のIT技術者数の比較があります。
アメリカでは7割のIT技術者は事業会社で働いているのに対し、日本では75%以上の人材がITサービス企業で働いています。なぜこれが大きな問題かというと、データ・AIの活用はデータの存在している事業会社の中においてこそ本領を発揮できるからです。これについては後述しますが、このような背景を受けて、多くのデータサイエンティストがITサービス企業から事業会社に転職するケースも増えてきました。
そこでは外部の会社では扱うことのできないさまざまなデータを分析する機会に恵まれているからです。そのようなデータサイエンティストの方々の転職先は、以前は金融サービス関連会社が多かったのですが、最近ではあらゆる業界で見られるようになってきました。
もう1つの問題は、データ・AI人材の絶対数の少なさです。日本のIT技術者の数は、日本の3倍以上いるとされているアメリカに遠く及ばず100万人程度とされています。その中でもデータ・AIを扱える人材はごく一部で、アメリカとの比較においてはさらに悪い状況だと、筆者も自らの経験から痛感しています。データ・AI人材不足のより詳細な分析と今後に向けた施策は重要な課題です。詳しくは安宅和人氏の『シン・ニホン』(News Picks Publishing、2020年)に書かれているため、一読をおすすめします。
上記の背景から、本書執筆時点においては、価値のあるデータを保有している、もしくは保有しうるような事業を提供している日本の事業会社には圧倒的な人材不足が発生しています。仮にデータサイエンティストがいたとしても、そのチームが解決できる問題はごく一握りで、企業が思い描くようなデータ・AIで会社をトランスフォーメーションさせるような活動につながっているケースは、ほとんど聞きません。
シチズンデータサイエンティストのインパクト
2012年にDataRobotがアメリカのボストンで創業した時、同社の創業者Jeremy AchinとTom de Godoyが思い描いていたのはまさにこのような課題の解決です。ここ20年ほどでのデータ・AI技術の発展はめざましく、その解決できる課題の種類や、実際の応用事例も多岐にわたってきました。
この技術を一部のデータサイエンティストの人々だけでなく、あらゆる人が使えるようにすることで、種類・量ともに今までよりもはるかに多くの問題解決に応用することができるようになると考えたのです。今までには思いもよらなかった課題の解決に、この技術が応用されることも出てくるでしょう。私がこの製品を見た時に感じた驚きも、同じ未来を想像して感じたものでした。
2016年に米ガートナー社はシチズンデータサイエンティストという概念を提唱しました。今まではデータサイエンティストしか行うことのできなかったAIを含む高度なデータ技術利用を、専門的な教育・訓練を受けていないビジネスパーソンでも利用できるようになることを指し、DataRobotをはじめとする技術の民主化によって、データ・AI活用の裾野が大きく広がりつつあることを示しました。
技術の民主化はデータ活用のあらゆるステップで進んでいます。データの管理、クリーニング・前処理、機械学習によるモデリング、予測結果の検証、モデルのデプロイ・実運用化など、データ活用がよりビジネスの中で密接に使われるようになるに伴い、より包括的なプラットフォームが必要とされています。
また、技術の民主化はデータサイエンティストに代わってデータ活用を行う実務者となるシチズンデータサイエンティストにとどまりません。データ活用戦略の立案を担当する経営層、AIプロジェクトのプロジェクトマネージャー、データインフラを構築するITエンジニアなど、あらゆる職種、職位の人たちがデータ・AIプロジェクトに関わります。本書で得られる知識、そして自らの手で一度はモデルを構築してみるという経験は、あらゆるビジネスパーソンにデータ・AI活用技術を基本的なリテラシーとして身に付けていくことが期待されています。