SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Data Tech 2024

2024年11月21日(木)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

EnterpriseZine Press

RAGで直面した課題を解決できるか、アドビが考えた「PDFファイル」を起点としたアプローチとは

社内に眠るドキュメント資産、非構造化データから最大価値を引き出す


 企業のデータは「非構造化データが8割」と言われる中、その活用をどう進めればいいのか。企業が生成AIを使い、ビジネス価値を増大させるためにも非構造化データの活用は避けて通れない。そして、データの8割を占める非構造化データには多種多様なものが含まれており、その代表格の1つとも言えるのが「PDFファイル」だ。企業内に蓄積してきたドキュメント資産を活用するという観点から、生成AIの使いどころを聞いた。

「RAG」に取り組む先進企業が直面している問題とは

 コロナ禍で、ドキュメントのデジタル化はかなり進んだ。以前は紙のワークフローが中心で、捺印のためだけに出社することもあった。官民問わずに「これではまずい」と、デジタル化の機運が高まったことは記憶に新しい。デジタル化で効率的な情報管理ができるように見える一方、日常業務をこなす中では未だに“情報過多”に悩まされているのではないか。

 日々のビジネス活動にともない情報は増える一方だ。数多のデジタル情報にアクセスできることは便利な反面、膨大なドキュメントを読み、必要な情報を探すことに多くの時間を奪われてしまっている。これは多くの人が体感していることだろう。だからこそ、負担を軽減するための手段として「生成AI」に期待が集まる。ある調査によれば、すべてのデータに占める構造化データの割合が2割であるのに対し、ドキュメントを含む非構造化データが8割と、圧倒的多数を占めるとも言われる。デジタル化が進んでも、非構造化データを活用できる準備はできていない。

 「生成AIに特有の懸念として、『ハルシネーション』と『セキュリティ』の2つを口にしない企業はない」と話すのは、アドビの西山正一氏(デジタルメディア事業統括本部 常務執行役員 兼 CDO)。企業における生成AIの活用が進まない要因に、この2つがあると指摘する。特に無料利用できるコンシューマー向け生成AIサービスのほとんどで、これらの懸念があるため「ビジネス利用はできない」と判断せざるを得ない企業も少なくないだろう。しかし、一部には、独自で懸念を払拭しようとする企業も出てきた。その際、好まれるアプローチが「RAG」である。

図1:生成AIの出力結果の精度を向上させる手法(出典:アドビ株式会社)
図1:生成AIの出力結果の精度を向上させる手法(出典:アドビ株式会社)
[画像クリックで拡大]

 RAGとは、既存のLLMに新しいデータを与え、追加学習で出力精度を高める手法だ。「良いアプローチだが、コストの問題が大きくなってきた」と西山氏。自社のビジネス文脈に即した結果を返すためには、常に新しいデータを与える“追加学習”を続けなければならない。たとえば、モデルの参照範囲を過去5年分と決めたとき、昨日までは対象だったデータでも今日は対象外となるデータも出てくる。そこに新たなデータが日々加わるとき、毎日データを入れ替えて追加学習を続けるのかと、疑問が生じても無理はない。

 さらに、入出力の制御も必要になる。LLMに社内文書をデータとして与える場合、なんでも読ませるわけにはいかない。ドキュメントごとに機密レベルの見直し、分類が必須となる。また、学習用データとして与えても問題ない情報が明確になっても、「管理職は閲覧できても、一般社員には開示しない」というように、出力結果へのアクセス制御も欠かせない。このためのコストとコントロールの問題を考慮したとき、RAGを100%のソリューションとして肯定することは難しいだろう。

次のページ
アドビが考えた、RAGと異なるアプローチ その仕組みとは

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
EnterpriseZine Press連載記事一覧

もっと読む

この記事の著者

冨永 裕子(トミナガ ユウコ)

 IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/20583 2024/10/17 17:31

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング