SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Data Tech 2024

2024年11月21日(木)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

EnterpriseZine Press

生成AIのハルシネーション克服へ RAG構築における「データ構造化」の4つのポイントとは?

複雑な文書を“正しく”構造化する「DLA」、ポイントとなる「チャンク最適化」

RAGシステム全体で回答の質を担保する、“チャンク最適化”

4. 文書レイアウト解析(DLA)+チャンク最適化

 ビジネスドキュメントを構造化するという点でDLAは有効な手法だが、RAGシステム全体として回答の質を担保するには、チャンク最適化が重要だ。チャンクとは、DLAによって同定された個々の区画(パラグラフ、図、表、見出しなど)を指す。チャンク最適化とは、RAGシステムがチャンクの意味を理解して高精度な回答を行えるように、チャンクにコンテキストを付与したり、チャンク同士を結合したりする処理のことだ。

 ストックマークは、ビジネスドキュメントに最適化したDLAに加えて、このチャンク最適化を導入した構造化サービス「Stockmark A Technology(SAT)」をリリースした[7]。以下に、SATで実装されているチャンク最適化の例を3つ紹介する。

図表チャンクへのコンテキスト付与

 DLAで認識した図や表には、それが何を表すのか、どのような意図を持って描かれているのかといったコンテキストが明確に記載されているとは限らない。そのため、RAGシステムにおいて、ユーザーの入力に対し検索がヒットしないことがある。SATはこの問題に対して、現在2つのアプローチで図表チャンクにコンテキストを自動付与する仕組みを導入している。1つ目は、図表キャプションマッチングという手法だ。図表の周辺に記載されている説明文を自動発見し、図表に紐づけることで、ユーザーの入力と説明文がマッチすれば図表を見つけられる。2つ目は、図表の要約だ。図表に対して、要約生成モデルが生成した文章を紐づけることで、実際には説明文が存在せずとも、図表が検索にヒットしやすくなる。

ページを跨ぐ表の認識

 DLAは文書1ページごとにレイアウトを解析する手法が主流だが、実際のワード形式の社内規定書類などにおいては、縦に長い表が複数ページにわたるケースが見られる。こうした表を1ページごとに解析すると、表の前半と後半が別々の表チャンクと認識されてしまい、後半のチャンクには表のヘッダーが存在せず、RAGシステムが表のセルの意味を理解できない場合がある。SATでは、ページ間の途切れている表チャンクをマッチングさせて元の表を復元する機能を搭載しており、これによって前述の問題を解消している。

読み順情報の付与

 RAGシステムの質を上げるためには、システムがドキュメントの“読み順”を保持していることが重要だ。読み順が正しければ、検索にヒットした箇所の前後の文章を、検索結果に混ぜて生成AIに入力することで、ドキュメントの文脈に合った回答を生成しやすくなる。ところが、DLAを行う各種モデルは、読み順を把握する能力を備えていないものも多い。そこでSATでは、文章中のXY座標や段組構成をもとに、DLAによって得られた各チャンクを読み順の通りに並び替えるアルゴリズムを導入している。

 現在公開されている汎用LLMは、構造化というタスクにおいて最適な手段とはなっていない。しかし、将来的にハルシネーションを抑制できれば、有用な選択肢となる可能性がある。ストックマークは、図表を含む設計書・提案書などの複雑で多様な資料を読解可能にするための、1000億パラメータのマルチモーダルLLMの開発を開始。マルチモーダルLLMの発展により、構造化というボトルネックが解消され、実用レベルの精度を持ったRAGシステムが普及すれば、企業における生成AI活用がより一層進むことが期待される。


この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
EnterpriseZine Press連載記事一覧

もっと読む

この記事の著者

谷本 龍一(タニモト リュウイチ)

 ストックマーク株式会社オープンデータユニットリーダー。生命情報学分野で修士号を取得後、2016年よりストックマークに参画。同社が開発する自然言語処理を活用した企業文化変革の支援を行うSaaSであるAnewsとAstrategyの立ち上げを担当。2019年にビジネスドキュメントの収集・解析を行うデー...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/20720 2024/11/18 09:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング