2値分類が基本だったDataRobotで多値分類が可能に
そんな移り変わりの激しいAI、機械学習の領域で、着実にサービスを拡大しているベンダーの1つがDataRobotだろう。同社は「機械学習の自動化でビジネスを革新」することを目指し、機械学習プラットフォームを提供している。DataRobotは5年前に設立、今回Ver3からVer4へとメジャーバージョンアップを行った。
「DataRobotの製品、サービスはほぼ完成の域にあると思われていますが、いまだに社員の半数は新機能などの開発を行うチームのメンバーです」と語るのは、DataRobot チーフデータサイエンティストのシバタアキラ氏だ。DataRobotのコアは開発にあり、今回のバージョンアップはそのコアチームによる大きな成果だと自信を見せる。
Ver4で大きく進化した1つが、多値分類機能の追加だ。これは顧客からの要求が多かったもので、情報のクラス分けやタグ付けを行い情報を種類ごとに分けることができる。従来は2値分類の機能が基本だったので、多値分類を行おうとすれば2値分類を繰り返して手間をかけ実現していた。Ver4では、多値分類を自動で行える。
「人間は、それがAというものかどうかではなく、さまざまなものを認識しながら生活しています。たとえばこの動物はネコかネコではないかではなく、これはネコであちらはイヌというように認識します。つまり多値分類ができるようになることは、人間にとってのさまざまな感性が増えるようなものです。人間が持っている知性のバリエーションに、機械学習が追いつく機能だとも言えます」(シバタ氏)
この2値から多値分類へと言うのは、技術的にハードルが高いものもあったが、DataRobotがもともと2値の分析をベースに製品を構築してきたことで、仕組みを大きく変えなければならないチャレンジがあったのだ。
Ver4から多値分類ができるようになっても、DataRobotの今までの使い勝手は大きくは変わっていない。データをドラッグ&ドロップでロードするところから始まり、ターゲットで2値か多値かを選択できる。設定が終わればボタンをクリックするだけで複数アルゴリズムが走り、モデルができあがる。
多値分類機能で、たとえばデータ項目に抜けがあるような場合に、複数候補から値を予測し埋めるようなことができる。多値分類の結果の制度を説明するために、どの変数が予測に影響を与えているかを分かりやすく表現する必要がある。今回は、そのための機能も加わっている。
「また多値分類の実現が難しかったのは、アルゴリズムからモデルを作る処理で必要となるメモリ量なども増え、処理を効率化するのにも時間がかかりました」(シバタ氏)