TISは、コージェントラボと協業することで同社のAI-OCRなどのサービスを活用した共同事業の展開を目指すという。協業の第1弾としてTISは、「Tegaki」をAI-OCRエンジンに採用した、紙資料のテキストデータ化と検索を可能にする紙資料データ化ソリューション「Paper Searcher」の提供を開始する。
「Paper Searcher」は、「テキスト領域の自動検知」「高精度なAI-OCRによるテキストデータ化」「辞書機能を活用した補正機能」という特徴をもったAI-OCRサービスになる。
このサービスは、クラウド上の「Paper Searcher」にスキャンした紙資料やPDFをアップロードすることで、資料上の手書き文字をテキストデータ化できる。
「テキスト領域の自動検知」により、従来のAI-OCRの処理で必要だった読み取り領域の事前指定が不要なため、非定型フォーマット書類の電子化を簡単に実現できるという。また、テキスト化したデータは補正を行うことが可能で、業界用語・化学物質名・企業用語などを辞書機能に登録することでテキスト化の精度を上げることができる。
TISは、「Paper Searcher」を報告書や議事録など紙で保管されデジタル化していない企業や、古い紙論文が大量にありデジタルデータでの検索が課題となっている大学、研究機関などに向けて提供していくという。
また、今後はコージェントラボをはじめとした協業企業とともに、AI-OCRサービスと帳票振分処理、補正処理、データ変換、データ連携といった周辺ソリューションを組み合わせた以下のような業務デジタル化ソリューションを展開していくとしている。
1. 受信した帳票を正確に帳票種類を分類し、振分処理を行い、後続の帳票OCR「Tegaki」に連携する、帳票振分ソリューション(今春提供開始予定)
2. クラウドFAXソリューション「TransFax」と連携し、受信したFAXをデジタル化し、完全なペーパーレスでFAX受付を行うソリューション
3. RPAソリューション「UiPath」を活用し、申請業務での申請書自動デジタル化や、AI-OCRクラウドサービスによりテキスト化されたデータを業務システムへ自動インプットする機能を実現する高度デジタルレイバーを実現するソリューション
「Paper Searcher」の概要
紙資料データ化ソリューション「Paper Searcher」は、AI-OCRとTISの画像処理技術を組み合わせて大量ドキュメントをテキストデータ化し検索を可能にするサービス。
1. テキスト領域の自動検知
画像上のテキストエリアを自動で検知することが可能で、従来のAI-OCRの処理で必要だった読み取り領域指定の事前作業が不要。
2. 高精度なAI-OCRによるテキストデータ化
コージェントラボの提供するAI-OCR「Tegaki」をAI-OCRエンジンとして採用しており、手書き文字を含めた高精度なテキストデータ化を実現。
3. 辞書機能を活用した補正機能
業界用語・化学物質名・企業用語といった通常の言語モデルでの補完が難しい用語は、辞書機能に登録することにより補正を行える。