SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Data Tech 2024

2024年11月21日(木)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

EnterpriseZine Press

生成AIのハルシネーション克服へ RAG構築における「データ構造化」の4つのポイントとは?

複雑な文書を“正しく”構造化する「DLA」、ポイントとなる「チャンク最適化」

複雑な文書を正しく構造化する“DLA”、注意すべきポイントは

3. 文書レイアウト解析(DLA)

 ハルシネーションを起こさず、かつ意味のあるまとまりを認識して構造化する技術として、文書レイアウト解析(Document Layout Analysis:DLA)がある。DLAの代表的な実現方法は、テキストと画像の両方のデータを同時に理解できるマルチモーダルAIだ。ドキュメント中に現れる図、表、パラグラフ、段組みなどを視覚的に学習するため、文章のレイアウトを意識した構造化が可能になる。

DLAを用いた構造化の例

[画像クリックで拡大]

 加えて、DLAは生成AIではないためハルシネーションの心配もない。活用においては、DLA向けにいくつかのモデルがOSSとして公開されており、利用可能だ。

公開されているDLA向けのモデル群と、文書内の区画(Text、Title、List、Table、Figure)認識精度の比較[6]

[画像クリックで拡大]

 しかし、複雑な表構造や高いデザイン性をもつドキュメントの解析には、公開されている汎用学習データセットをマルチモーダルAIに学習させるだけでは不十分だ。そこで、ストックマークは独自に保有するビジネスドキュメントを学習させることで、スライド形式の企画書や報告書、グラフィカルな説明を含む製品マニュアル、技報や論文や特許といった技術文献など、様々な形式のドキュメントを構造化できるようにした。同社による定量比較では、構造化の精度の点で高いスコアを実現、構造化の強力な選択肢を提供している。

画像を説明するテキストなくても可

DLAサービスの精度比較。文章中の各区画の位置と種類をどれだけ正解できたかを、適合率(予測が「正解」としたもののうち、実際に正しかった割合)、再現率(実際の正解のうち、予測で「正解」と捉えられた割合)、F1スコア(適合率と再現率の調和平均)を算出して評価。区画の位置はIoU(正解領域に対する予測領域の重なり度)0.5以上を正解としている。Stockmark DLAはconfidence>0.5の結果

[画像クリックで拡大]


[6]Vision Grid Transformer for Document Layout Analysis」(Cornell University, 2023年8月29日)

次のページ
RAGシステム全体で回答の質を担保する、“チャンク最適化”

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
EnterpriseZine Press連載記事一覧

もっと読む

この記事の著者

谷本 龍一(タニモト リュウイチ)

 ストックマーク株式会社オープンデータユニットリーダー。生命情報学分野で修士号を取得後、2016年よりストックマークに参画。同社が開発する自然言語処理を活用した企業文化変革の支援を行うSaaSであるAnewsとAstrategyの立ち上げを担当。2019年にビジネスドキュメントの収集・解析を行うデー...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/20720 2024/11/18 09:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング