膨大で散在する社内データ、どう扱う?
菊地氏は、企業が現在、社内データの扱いに苦慮している点として
・日々、非構造化情報が増えていく
・必要な情報は社内各所に散在
・目的の情報が見つからない
の3つを挙げ、必要な情報を必要なタイミングで取り出そうにも探すことが困難な状況にあると語る。「情報格納先であるファイルもフォルダもサイズがどんどん肥大化し、数も増えて続けている。そんな中にあっていかに精度が高くて迅速な情報検索を可能にできるのか - この課題に対するソリューションを提供するのが我々の使命」(菊地氏)
ここでジャストシステムが提案する製品が、強力な"エンタープライズサーチ"の導入である。ファイルサーバ、Webサーバ、RDB、SharePoint、Notesなど社内に散在するありとあらゆるサーバを横串で高速検索し、高い精度で目的の情報を瞬時に引き出すというものだ。「大規模、大容量に対応するだけではなく、目的の情報にヒットする精度が高いことがエンタープライズサーチのあるべき姿。そのために必要な機能は高精度な検索エンジン、情報に確実に到達できる利便性、そして自社のシステムやワークスタイルとの適合性」と菊地氏。これを備えた製品がジャストシステムの「ConceptBase Enterprise Search」だとする。
高精度検索を支えるハイブリッド検索エンジン「NL-Vgram」
ConceptBase Enterprise Searchは、ジャストシステムが30年以上に渡り培ってきた高度な日本語処理技術のノウハウが詰め込まれた製品でもある。これまで3,700社を超える国内企業に導入された実績をもち、導入企業からは「膨大なフォルダ/ファイルの中から目的の文書が見つかる唯一の検索システム」という声が多く寄せられている。
「ジャストシステムだからこそ実現できた」と導入企業に言わしめる高精度検索を支えるのは、同社オリジナルのハイブリッド検索エンジン「NL-Vgram」である。これは検索結果のノイズが少ない自然言語処理方式「NLP」と、対象文字列を1 - n文字ずつに区切ることで検索漏れをなくした「V-gram」をかけ合わせ、同社独自の方式で発展させたものだ。さらに、
・一般用語を収録した「システム辞書」
・専門用語を収録した「オプション辞書」
・独自用語を収録した「ユーザー辞書」
という3つの辞書がConceptBase Enterprise Searchの高性能検索を支えている。これらの特徴により、日本語がもつさまざまな"表記ゆれ"や、通常の検索エンジンでは漏れがちな社内独自の用語の検索にも高い精度で対応することが可能になっている。「たとえば"京都"を含む文書を検索したい場合、一般的な検索エンジンでは"東京都"を含む文書まで選ばれてしまうが、ConceptBaseでは"京都"のみを含む文書だけが提示される。他社のエンタープライズサーチ製品と比べてその精度の差は歴然」(菊地氏)
ビッグデータ時代の到来により全社規模の情報統合基盤となったエンタープライズサーチ
ConceptBase Enterprise Searchが国内企業から高い支持を得ているのは、高精度の検索エンジンだけではなく、データが増えるほどに実感できるというダイナミックで高速な絞り込み機能、そして全社規模の情報基盤としての導入/運用のしやすさといった点も大きい。たとえ検索結果が膨大であっても、キーワードからファイルやフォルダを高速で絞り込むことが可能で、かつハイライト表示されるのでフォルダ内の文書を簡単に探すことができる。また、Active Directoryと連携が可能なので、ユーザごとのアクセス権に従って検索可能なフォルダを自動表示する。こういったきめの細かいインタフェースも"ジャストならでは"と言われるゆえんなのだろう。
また、運用面においても稼働監視機能や自動更新、アクセス権チェックなどが簡単に行えるようになっている。さらにクラウドやモバイルデバイスの普及を踏まえ、オンプレミスとクラウドを融合した環境やスマートフォン/タブレットからの活用も可能だ。NotesやRDBなど既存環境との接続もオプションで対応することができる。
ビッグデータ時代を迎え、いまやエンタープライズサーチは特定部門の業務ツールから全社情報統合基盤へと変わりつつある。日本語には絶対の自信をもつジャストシステムの"ジャストメソッド"による高速検索システムは、社内に埋もれている膨大なデータから知見を導きだす可能性をより高めてくれそうだ。