DataRobotは2012年、アメリカで2人のデータサイエンティストが創業したのがはじまり。日本におけるビジネスは2016年前後から動いていたものの、2017年2月に改めて日本オフィスを開設した。日本でカントリーマネージャーを務める原沢滋氏はイベント冒頭に登壇し、経緯を説明するとともに「日本を元気にしたい。ぼくの夢でもあります」と意欲を語った。
本イベントの事前登録を開始したのは10月5日。AIや機械学習への関心の高さか、3週間で申し込みが1200人に達し、イベント2週間前でやむなく事前登録を打ち切ったという。基調講演会場は多くの聴講者で席がうまった。
【参考記事】
データベースの世界から機械学習の予測の世界へ―DataRobot 原沢滋さん
DataRobotは世界でトップクラスのデータサイエンティスト集団でもある。データ解析のモデルを競う「Kaggle」というのがある。データサイエンティストの世界選手権のようなものだ。DataRobotにはKaggleの上位入賞経験者が多くいる。
近年ビジネスにおけるデータ解析が重要性を帯びつつも、データ解析は時間と手間がかかり、精度を高めるのが難しい。統計の高度な知識を要し、解析前にはデータ整形など手作業が多くあり、データモデルをあれこれ試すなど試行錯誤の連続で時間がかかる。
DataRobotには多数の優秀なデータサイエンティストを抱えており、彼らの力でデータ解析サービスを行う……のではない。彼らの力をソフトウェアに組み込むということをした。データサイエンティストがやることを機械に教え込み、自動化するプラットフォームを提供している。
Jeremy Achin氏はDataRobotを「世界で唯一の真の機械学習自動化プラットフォーム。自動化を自動化します」と説明する。DataRobotのプラットフォームを使うと、あたかも大量のデータサイエンティストが人海戦術で解析をするかのように一斉に多数のモデルを試し、それらの結果を比較するため、解析精度は高い。DataRobotの中でKaggleが繰り広げられているようなものだろうか。
データサイエンティストには多種多様なスキルが必要となるものの、機械学習の自動化を最大限に活用すると、人間がすべきことは人間でなければ判断できないことに限られてくる。プログラミングやアルゴリズムに関する処理は機械学習の自動化でなされるため、人間に求められるスキルはビジネスに関する課題やデータに関する知識が重要になってくる。
Achin氏は「我々にはDataRobotをはるかに強いロボットにするため、AIのリーダーとなるためのプランがあります。歴史を一緒に変えていきましょう」と会場に呼びかけた。
実際にDataRobotとはどういうものか。チーフデータサイエンティストとなるシバタアキラ氏がDataRobotをデモを交えながら解説した。シバタ氏は日本人で1人目となるDataRobot社員でもあり、日本で有名なデータサイエンティストの1人だ。
【参考記事】
テクノロジーと実世界の交差点のど真ん中で―DataRobot シバタアキラさん
DataRobotはソフトウェアで、クラウドまたはオンプレミスで稼働させる。解析に使うデータを読み込み、何を予測するのかを入力し、「開始」ボタンを押せば自動的に解析がはじまる。多種多様なデータモデルや最新のアルゴリズムを用いて、様々なアプローチで自動的に解析を進めていく。
デモでは金融業における貸し倒れのリスクを予測分析した。人物のプロファイル、借りようとした金額や目的、実際に貸し倒れたのかどうかのデータから、貸し倒れになる傾向を割り出し、実際にローンを申し込んだ人に対して貸し倒れになるかどうか予測する。
最新版となるDataRobot 4.0は近年では大きなアップデートとなる。(「True/False」のような二値分類ではなく)多値分類、異常値検知、時系列モデル、モデル係数の手動調整、解析状況を監視するリソースモニターなどの機能追加や拡張がなされている。
DataRobotはビジネスとしてもプラットフォームとしても、日本で大きな一歩を踏み出した。