「モノごと」を正確に伝えるための「オントロジー」

日本データマネジメント・コンソーシアム(JDMC)理事 北澤敦氏(NEC AIプラットフォーム事業部 技術主幹)
1983年NECソフト入社、NECにてリレーショナル、オブジェクト指向、NoSQLデータベースの開発に従事。2007年からSemantic Computing学会に所属、2017年以降、同学会の国際会議でgeneral co-chairを務める。現在NECソリューションイノベータ プロフェッショナルフェローで、FIWAREを中心としたIoTプロジェクトをリード。
──オントロジーという言葉が注目されているようです。そもそもオントロジーとは、どういうものなのでしょうか?
オントロジーについては、日本でもかなり昔から研究されており、学会の活動も盛んですが、私が実用的な面で関心を持ったのは、IoT関係の仕事に携わるようになったここ数年です。
オントロジーについては「概念を整理するモノ」という説明のされ方がありますが、「概念」という言葉がわかりにくいですよね。シンプルに言って「世の中の様々な“モノごと”を正確に整理するためのツール」と理解すれば良いと思います。
たとえば、ここに私の名刺を入れるモノがあり、この名刺の入れ物の中に、あなたの名刺が入っているという場合を考えてみます。私の名刺入れとあなたの名刺は、中に入っているという関係があるわけですが、これはモノとモノとの直接の関係です。この場合、まだ概念ではありません。
しかし、モノとモノの関係をきちんと整理していくと、ここにある名刺の入れものとあなたが持っている名刺の入れものをまとめて、「名刺入れ」と呼ぼうということになり、そこで概念が生まれます。「名刺入れとは、名刺を入れるもの」ということをいったん決めておくことで、私の名刺入れの中に、あなたの名刺が入っている場合、それは名刺と名刺入れの関係として正しい、ということが判断できます。
このように、モノとモノの関係を整理していくときに、一段上のレベルで規則を決めると、まちがった関係が出来なくなり、正確に伝達することができます。これがオントロジーの良いところだといえます。
グラフベースで可視化することで「関係」を整理する
データが溢れてくると、それらをきちんと整理し正確に伝えるという必要が増えてきます。しかし、こうしたデータの関係を言葉で表現するとなると、とても曖昧になる。一方でオントロジーは論理的で正確だけれども論理式で書いたりすると抽象的になる。データベースの設計に近いものなので、全体像がみえる可視化や間違いを自動検出してくれるチェックツールがないと大変面倒です。オントロジーが本当に使えるようになるためにはこうした関係を整理し、わかりやすくするツールが重要なのです。昔インターネットがHTMLとそれをきれいに表現するネットスケープなどブラウザの登場によって一気に普及したことと同じですね。

そのために利用できるのがグラフです。上の図にあるように、モノとモノの関係はグラフで表現することができます。Webの世界で言えばHTMLみたいなものです。

そして、一段上のレベルの規則も同じようにグラフで表現することができます。たとえば上の図の例では、横浜も東京も都市という意味では同じ性質のものだけれども、横浜は首都ではないので首都がもつ性質は持っていないことがはっきりわかります。別の言い方をすると、東京も横浜も都市という集合に属するけれども、都市の一部に首都という集合があるとして、横浜は首都という集合には属さないという言い方もできます。