生成AIの企業活用

Snowflakeが発表したジェネレーティブAI 第一弾は非構造化データからの情報抽出

「Snowflake Summit 2023」レポート

2023/07/13 08:00

通知

　米Snowflakeは6月26日から29日にかけてラスベガスで年次カンファレンス「Snowflake Summit 2023」を開催し、数多くの新発表を行った。同社が提唱する「データクラウド」の中で、ジェネレーティブAIはどのように位置付けられているか。基調講演の内容から探る。

通知

構造化データ、半構造化データ、非構造化データを区別なく

　データ分析やAI活用から価値を引き出したいと考える企業にとって、最大の障壁が社内におけるデータサイロである。新しいアプリケーションの導入にデータサイロの発生は付きものだ。社内で使う様々なアプリケーションデータを連携させるには、ユーザーが常に質の高いデータにアクセスできるよう、理想的な状態を維持しなくてはならない。データ管理者の継続的な努力なくしてはできないことだ。Snowflakeはこの脱サイロ化を、企業が「シングルプラットフォーム」を実現する上で対処するべき重要なテーマの1つと考えている。

図1：Snowflakeが掲げる「シングルプラットフォーム」出典：Snowflake　[画像クリックで拡大]

　シングルプラットフォームが実現すれば、ユーザーはあらゆる種類のデータに自由にアクセスできるようになる。今でも多くのデータを扱っていると思うかもしれないが、企業の中にあるデータは構造化データだけとは限らない。JSONやXMLのような半構造化データもあれば、画像のような非構造化データもある。Snowflakeの提唱する「データクラウド」は、形式が異なるデータを含め、あらゆるデータを1つのプラットフォーム上で扱えるようにすることを目指すものである。それが実現すれば、ジェネレーティブAI時代の企業のニーズにも対応できる。

　既に同社の取り組みは半構造化データから始まっている。この考えを非構造化データへと拡張し、提供するソリューションが「Document AI」になる。ジェネレーティブAIが実行できるタスクのうち、ホワイトカラーの業務と関連の深いのが大規模言語モデル（LLM）に対し、テキストで質問をするとテキストで回答を得られる「Text-to-Text」であろう。LLMを組み込んだアプリケーションは、いずれもより良い結果を出せるよう、テキストデータで学習している。しかし、その学習範囲に非構造化データは含まれてはいない。

　「Snowflake Summit 2023」の基調講演に登壇したスノーフレイク会長兼CEOのフランク・スルートマン氏は、「PDFファイルの中身を人間が読むことはできても、ソフトウェアにはできません」と指摘し、他のデータと同様にソフトウェアが扱える形式に変換し、学習材料にすることで、企業はジェネレーティブAIからより多くの価値を引き出せるようになると示した。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます
・翔泳社の本が買える！
500円分のポイントをプレゼント

メールバックナンバー

新規会員登録無料

次のページ
非構造化データから情報を抽出するDocument AI

この記事は参考になりましたか？

広告を読み込めませんでした

広告を読み込み中...

印刷用を表示

関連リンク: アクセンチュアが推進する「EnterpriseGPT」とは？プライベート型ジェネレーティブAIの構築と運用の勘所

【徹底解説】今知るべきChatGPTの「脱獄」手法による攻撃とは？
生成AIの企業活用連載記事一覧: 【200人以上が参画】オムロンの生成AI活用の屋台骨を支えるのは“業務課題を持つ”メンバー...

コクヨ本気のAI人材育成で成果──システム開発スキルを叩き込むなど、独自の人材育成に光明

日立製作所 Generative AIセンター吉田氏が語る生成AIの「責任ある」活用──...

もっと読む

この記事の著者: 冨永裕子（トミナガユウコ）

　IT調査会社（ITR、IDC Japan）で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事