SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Enterprise IT Women's Forum

2025年1月31日(金)17:00~20:30 ホテル雅叙園東京にて開催

Security Online Day 2025 春の陣(開催予定)

2025年3月18日(火)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

生成AIの企業活用

Snowflakeが発表したジェネレーティブAI 第一弾は非構造化データからの情報抽出

「Snowflake Summit 2023」レポート

 米Snowflakeは6月26日から29日にかけてラスベガスで年次カンファレンス「Snowflake Summit 2023」を開催し、数多くの新発表を行った。同社が提唱する「データクラウド」の中で、ジェネレーティブAIはどのように位置付けられているか。基調講演の内容から探る。

構造化データ、半構造化データ、非構造化データを区別なく

 データ分析やAI活用から価値を引き出したいと考える企業にとって、最大の障壁が社内におけるデータサイロである。新しいアプリケーションの導入にデータサイロの発生は付きものだ。社内で使う様々なアプリケーションデータを連携させるには、ユーザーが常に質の高いデータにアクセスできるよう、理想的な状態を維持しなくてはならない。データ管理者の継続的な努力なくしてはできないことだ。Snowflakeはこの脱サイロ化を、企業が「シングルプラットフォーム」を実現する上で対処するべき重要なテーマの1つと考えている。

図1:Snowflakeが掲げる「シングルプラットフォーム」 出典:Snowflake
図1:Snowflakeが掲げる「シングルプラットフォーム」 出典:Snowflake [画像クリックで拡大]

 シングルプラットフォームが実現すれば、ユーザーはあらゆる種類のデータに自由にアクセスできるようになる。今でも多くのデータを扱っていると思うかもしれないが、企業の中にあるデータは構造化データだけとは限らない。JSONやXMLのような半構造化データもあれば、画像のような非構造化データもある。Snowflakeの提唱する「データクラウド」は、形式が異なるデータを含め、あらゆるデータを1つのプラットフォーム上で扱えるようにすることを目指すものである。それが実現すれば、ジェネレーティブAI時代の企業のニーズにも対応できる。

Snowflake 会長兼CEO フランク・スルートマン氏
Snowflake 会長兼CEO フランク・スルートマン氏

 既に同社の取り組みは半構造化データから始まっている。この考えを非構造化データへと拡張し、提供するソリューションが「Document AI」になる。ジェネレーティブAIが実行できるタスクのうち、ホワイトカラーの業務と関連の深いのが大規模言語モデル(LLM)に対し、テキストで質問をするとテキストで回答を得られる「Text-to-Text」であろう。LLMを組み込んだアプリケーションは、いずれもより良い結果を出せるよう、テキストデータで学習している。しかし、その学習範囲に非構造化データは含まれてはいない。

 「Snowflake Summit 2023」の基調講演に登壇したスノーフレイク会長兼CEOのフランク・スルートマン氏は、「PDFファイルの中身を人間が読むことはできても、ソフトウェアにはできません」と指摘し、他のデータと同様にソフトウェアが扱える形式に変換し、学習材料にすることで、企業はジェネレーティブAIからより多くの価値を引き出せるようになると示した。

次のページ
非構造化データから情報を抽出するDocument AI

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
関連リンク
生成AIの企業活用連載記事一覧

もっと読む

この記事の著者

冨永 裕子(トミナガ ユウコ)

 IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/18048 2023/07/13 08:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング