「iKnow」は、文章(非構造化データ)を意味のあるデータ項目(構造化データ)に変換することのできる自然言語解析技術。従来、日本語の言語解析は、予め定義した辞書やオントロジーに基づき、文を単語(意味を持つ最小単位)に分割する形態素解析と呼ばれる手法に代表される技術が一般的だったという。
「iKnow」は、文を単語に分割するのではなく、言語構造を基に文章そのものから意味のある一連のユニット(「エンティティ」)を見つけるという「ボトムアップ手法」による解析を行う。そのため、辞書やオントロジーを予め定義する、それらをメンテナンスするといった作業が不要だという。ユーザーは検索する対象が不明な場合であっても、文章の中から本質を発見することが可能になる。
「iKnow」は、文章の中から意味のある最大単位の「エンティティ」を認識し、「エンティティ」同士の関連性を示す近接性(Proximity)や文書内での特定のエンティティの優位性(Dominance)を算出し、非構造化データの内容を理解し活用するための強力な解析技術を提供するとしている。
インターシステムズのアプリケーションパートナーであるデータキューブは、「InterSystems Caché」を基盤とした同社の臨床データ分析システム「medCube(メディカルキューブ)」に「iKnow」を使いフリーテキスト検索・解析機能を加えて、アプリケーションの拡張を行っている。このシステムは、2017年1月に熊本大学医学部附属病院で試行的活用を開始する予定だという。
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア