Deep Learningが人の能力を超えた
小林氏は、Deep Learningの登場で画像認識の精度が格段に向上したという話から始めた。
「Deep Learning登場以前は、認識の誤差が30%くらいありました。2012年にDeep Learningが登場してからは認識率は30%ほど向上し、誤差は16%くらいに下がっています。その後も年率50%程度、指数関数的に精度は向上しています」(小林氏)
2015年には人の認識率である誤差5%を超え、2017年には2.25%にまでDeep Learningでの画像認識精度は上がっている。つまり、今や人よりDeep Learningのほうが画像認識率は高く、差は開く一方なのだ。音声認識精度も同様で、AppleのSiriもDeep Learningを利用してから実用的なものになった。「機械であれば24時間さぼらずに働きます。この辺りから完全にモードが変わりました」と小林氏は指摘する。
そんなDeep Learningを活用するAI市場は、今後右肩上がりで拡大する。技術の普及とともに適用範囲も拡大するので、より一層の市場拡大が期待される。「AIはありとあらゆるところに、当たり前のように入ってくるでしょう。その中でDeep Learningの技術が、かなり重要なものになります」と小林氏。
ところでDeep Learningは、簡単に言えば脳の学習機能をコンピュータでシミュレーションするニューラルネットワークを用いた技術。人工ニューロンを複数合わせたものがニューラルネットワークで、これは1960年ころから研究されている分野でもある。
「1990年代くらいまでは、コンピュータの能力が足りずにニューラルネットワークの中間層を増やすことができませんでした。それが2006年になりコンピュータの能力も上がり、中間層をより深い100層などに増やしたニューロンの構成が可能になりました。今ではさらに1,000万を超える規模まで中間層を増やし、人間の能力を超えるようになりました」(小林氏)
このように人間をも超えるDeep Learningだが、その利用は従来型の機械学習よりも「遙かに簡単です」と小林氏は言う。環境が整備され簡単に使えるので、機械学習を使いこなすスキルがあることよりも学習するデータをたくさん持っている人に優位性が出てきている。その上で「持っているデータから何を解決できるのか、その発想が必要になります。また、Deep Learningを活用するために、どのようにしてデータを集められるかも重要です」(小林氏)。
現状でDeep Learningを利用するには、まずはデータセットを用意することになる。続いて、学習するためのニューラルネットワークの構造を設計する。ここまでは人が行う作業だ。次は、用意したデータセットを使いニューラルネットワークで学習を行う。この部分は今では、さまざまなツールを用いることで自動化している。たとえば、画像とそこに写っているものに対する質問データを大量に用意し、それを学習する。そうすれば写真を見せて、そこに何が写っているかの質問をすれば、適切な答えが返ってくるDeep Learningの仕組みを構築できるのだ。