PredictiveとGenerativeという2つのモデルによる自然言語処理のアプローチ
Q:自然言語処理の技術で、現状どのようなことが実現できるのでしょうか?
スン氏:自然言語処理で実現できることは、機械学習のPredictive Model(予測モデル)かGenerative Model(生成モデル)かで異なります。Predictive Modelでは予測を行います。たとえば文書の中で気になるところはどこにあるかを予測します。マーケティングに関する文章であれば、文章の中のどこに伝えたい製品の記述があるかを予測するのです。またメールのやり取りなどからスケジュールに関することを理解したければ、時間や場所、誰と会うかが文章のどこにあるかを予測します。Predictive Modelでより高いレベルになれば、その文章の内容がポジティブかネガティブかも予測できます。
一方でGenerative Modelを使って実現できるのは、記事の要約を作るといった自然言語の処理になります。文章の中の特定のトピックを取り出し、それについて説明することができます。高度なチャットボットなどでは、Predictive ModelもGenerative Modelも両方必要になります。Predictiveで会話のどこにキーワードがあるかを予測し、Generativeでどう答えれば良いかを理解し、その答えを作成します。
特定のトピックスに関するチャットボットのやり取りなどは、自然言語処理である程度実現できるようになっています。しかしながらGenerative Modelのところを重視して、フリーフォームでやり取りしたり記事などの要約をしたりするのはまだ不十分なところもあります。Predictive Modelを使った自然言語処理のほうが、現時点では多く使われています。
もう1つの自然言語処理のパートが、文脈やニュアンスの読み取りを行うリーズニングです。これは2つのモデルのアプローチとは異なります。たとえばIQテストのようなもので、AはBの姉であり、Bはグリーンが好きで、Cはブルーが好きでと言った説明が続き、最終的にAは何が好きかを推論するような課題を解くのです。その推論をマシンで行ところは、まだ人より遅れているところです。
ちなみにAppierでは、Predictive Modelでの自然言語処理に着目しています。膨大な文章の中から適切なキーワードを抽出するところに注力しています。それで膨大な情報の中から重要なものを見つけ出し、それをインサイトとします。そのインサイトを使って推論するところは、人が行うようなアプローチです。
Q:ここ最近、マシンによる翻訳がだいぶ進化しています。しかしながら英語から日本語への翻訳などは、まだまだ難しいものがあるようにも見えるのですが?
スン氏:翻訳はPredictiveとGenerativeの両方のモデルを組み合わせて実現します。元の文章からキーワードを抽出してそれを理解し、翻訳した結果を出力します。単純な「元の文章と訳された文章」の対でとらえると、AIのタスク的には楽な処理だとも言えます。一方で通訳者や翻訳者は、文章全体のコンテキストを理解して翻訳します。これには文章や会話のバックグラウンドにある知識も使い翻訳しています。マシンでは、そういったところまではなかなかできておらず、遅れているところです。