「生成AI」が変えるコンテンツ活用の近未来像
ChatGPTが世に出てきたとき、皆さんも衝撃を覚えたのではないでしょうか。簡単な指示を与えるだけで、読みやすい文章を作成してくれたり、長い文章を要約してくれたり、学習した知識を使って質問に答えてくれたりと、有能なアシスタントが側にいるような感覚で使える利便性に「もう手放せない」と感じている方も少なくないのではないでしょうか。ChatGPTをはじめとする「生成AI」により、コンテンツ活用がどのように変わっていくのかが最終回となる本稿のテーマですが、データ分析・活用の世界が、AI(人工知能)/ML(機械学習)によってどう変わったのかを思い出してみれば、その答えは明確だと筆者は考えています。
上図1の「Before」は、データウェアハウス(DWH)を中心とした、典型的なデータ分析・活用基盤を表しています。データの利用目的に最適化されたデータマートを構築後、BIツールで分析し、仮説検証を行う。そして、検証結果レポートを作成して関係者と共有。メンバーはそれを読み込み、理解した上で分析会議に臨む。ときには仮説が否定され、BIツールによる分析からやり直すなど“手戻り”が発生する……このようにデータを「知識」に変えて「インサイト」を獲得するまでには、多くの時間を要していました。
これを解決すべく考案された、アジャイルなアプローチが図1の「After」が示す「データレイク」です。あらゆるデータを保管する「レイク」を構築し、ユーザー自身でデータプレパレーション(分析のために生データを加工するなどの前工程)も行える環境を実現することで、“データの民主化”が推進されました。そして、何よりも画期的だったのがサンドボックスのデータから「知見」を抽出する処理がAI/MLにより省力化されたことです。
データ分析の世界では、「ビールと紙おむつを同時に購入する顧客が休日に多いことを突き止めた」のような例え話が昔からよく引用されていますが、このような“客観的な気づき”を得るまでの時間がAI/MLにより圧倒的に短縮されました。コンテンツ活用の世界では、人間が自分の眼で見て得る“主観的な気づき”がその価値となるわけですが、それにかかる時間を圧倒的に短縮してくれるものが生成AIだと考えます。
上図2の「Before」は、コンテンツが一元管理されていない世界です。チャットツールやCRM、ファイルサーバーなど、コンテンツを管理する場所が複数ある状態で「目的別のコンテンツ管理」がなされています。これが時間を浪費させる原因になることは、連載vol.2で解説しました。
そして、コンテンツ活用にはもう1つ大きく消費される時間があります。それが「理解する時間」です。たとえば、100ページのドキュメントを読み終えるために、1ページあたり1分で読み進めたとしても1時間40分かかってしまいます。しかし、これはあくまで“読み終えるまでの時間”です。内容を理解するまでには不明点を調べたり、事情に詳しい専門家に訊ねたり、再度読み直したりするような時間が必要でしょう。
そこで、コンテンツ管理を一元化することで「コンテンツレイク」を実現し、生成AIを活用するというアイデアが生まれました。それを示したのが図2の「After」です。一元管理により“探す時間”が短縮されることは自明ですが、ドキュメントの要約や内容に関する質疑応答をAIに行わせることで「理解する時間」も大幅に短縮できます。もちろん、ChatGPTのようなチャット形式のアプリケーションを使う場合には、読み込ませたい文章をコピー&ペーストするなど面倒な操作が必要ですが、コンテンツ管理システム側に“生成AIとの連携機能”が搭載されていれば「この文書を要約して」「この文書に登場する人物Aの発言内容をまとめて」と指示するだけでよく、操作はシンプルになるでしょう。
そして何より、コンテンツ管理システム側でユーザーのアクセス権限が厳格に定義されるため、一貫したセキュリティポリシーで生成AIを活用できるメリットが生まれます。たとえば、ユーザーがアクセスできない機密文書から生成AIが情報を得て、その内容を元に回答してしまえば、それは重大なセキュリティホールとなり得ます。それを防止する観点からもコンテンツ基盤と生成AIは密結合されていることが理想だと言えるでしょう。