「iKnow」は、文章(非構造化データ)を意味のあるデータ項目(構造化データ)に変換することのできる自然言語解析技術。従来、日本語の言語解析は、予め定義した辞書やオントロジーに基づき、文を単語(意味を持つ最小単位)に分割する形態素解析と呼ばれる手法に代表される技術が一般的だったという。
「iKnow」は、文を単語に分割するのではなく、言語構造を基に文章そのものから意味のある一連のユニット(「エンティティ」)を見つけるという「ボトムアップ手法」による解析を行う。そのため、辞書やオントロジーを予め定義する、それらをメンテナンスするといった作業が不要だという。ユーザーは検索する対象が不明な場合であっても、文章の中から本質を発見することが可能になる。
「iKnow」は、文章の中から意味のある最大単位の「エンティティ」を認識し、「エンティティ」同士の関連性を示す近接性(Proximity)や文書内での特定のエンティティの優位性(Dominance)を算出し、非構造化データの内容を理解し活用するための強力な解析技術を提供するとしている。
インターシステムズのアプリケーションパートナーであるデータキューブは、「InterSystems Caché」を基盤とした同社の臨床データ分析システム「medCube(メディカルキューブ)」に「iKnow」を使いフリーテキスト検索・解析機能を加えて、アプリケーションの拡張を行っている。このシステムは、2017年1月に熊本大学医学部附属病院で試行的活用を開始する予定だという。