合成データが生成できるSAS Data Maker
冒頭に登壇したジャレッド・ピーターソン氏は、「生成AIで今抱えている問題が全て解決されると思うべきではない。戦略的に対応しなければ混乱の原因にもなりうる。適切なプロセス、ツール、ガバナンスが不可欠であり、だからこそSAS Viyaで良い状態を維持し、ビジネスの生産性向上に取り組んでほしい」と訴えた。
現在のSASのAI戦略は、「LLM」「合成データ」「デジタルツイン」の3つのテーマに焦点を当てている。最初に紹介のあったSAS Data Makerは2つ目の合成データに関係している。合成データとは、統計的に本物のデータに劣らない品質のデータを生成するもので、SAS Data Makerを利用することで、簡単に早く必要な合成データを得ることができる。なぜ合成データが必要かと言えば、可能な限り多くのデータを収集しても、そのデータを全て利用できるとは限らないためだ。
2番目に登壇したマリネラ・プロフィ氏も、「現実世界のデータにはお客様の個人情報が含まれることもあれば、偏見が含まれている可能性もある。その場合、分析やAIのトレーニングには使うことはできない。集めたデータのうち、90%のデータが問題なく利用できるものだとしても、10%がそうでなかったとしたらどうするか。現場はこの問題に苦しんでいる。合成データは理想と現実のギャップを埋める方法を提供してくれる」と説明していた。
AIは多くのデータを必要としている。ましてやLLMが参照するデータが出力結果の質を決めるともなれば、これまで以上に信頼できるデータを大量に収集しなくてはならない。生成AI活用の進展に伴うニーズに応えて、SASがプライベートプレビューで提供しているのがSAS Data Makerになる。SAS Data Makerを使うと、データセットを指定し、合成データを作るように指示するだけで、数分程度で分析に利用できるデータが揃う。データエンジニアは、できた合成データの質の確認や、元のデータセットと合成データの類似性を確認もできる。
すでにある大規模金融機関がSAS Data Makerを使い、個人向け融資の焦げ付き確率を93%の精度で予測することに成功した。モデルのパフォーマンスも50%の向上が認められたという。合成データは、企業がより速く正確に意思決定を行うことを支援してくれる。2024年7月には、Snowflake MarketplaceでData Makerが利用できるようにもなった。このパートナーシップで、2社の製品を利用している場合の利便性が向上したことになる。SAS Data Makerの一般提供開始は2024年末を予定している。
生産性向上のために提供するSAS Viya Workbench
次にピーターソン氏が紹介したのが、2024年4月に一般利用が始まったSAS Viya Workbenchである。SAS Viya WorkbenchはAIモデル構築に特化した開発環境で、主力製品であるSAS Viyaを拡張機能として提供するものになる。データが増えれば、モデルを実装するためのコードも増える。ピーターソン氏は、SAS Viya Workbenchをコードの増加に開発者が対応できるようにするためのものと位置付け、クラウドネイティブでスケーラブルな環境の提供を重視していることを強調した。プロフィ氏も、「Viya Workbenchの良いところはSAS言語にもPython言語にも対応すること」と評する。現時点では、SASとPythonが利用できるのみだが、2024年末に向けてRへの対応も進めているところだ。
SAS Viya Workbenchはほんの数秒で、開発環境を立ち上げることができ、Jupyter Notebook/JupyterLabおよびVisual Studio Codeの2つの開発環境に対応している。また、セルフプロビジョニング機能やセルフターミネイト機能を備え、AI開発者は最小限のITサポートで柔軟性の高い開発環境を利用できる。プロフィ氏は、「データ量が増えてくれば、コンピュートサイズを大きくするだけで、SAS Viya Workbenchをスケーリングできる。スケーラビリティニーズに環境が適応してくれる」と説明した。
また、分析専用の環境には、カスタマイズ可能なCPU/GPUが搭載され、プロジェクトニーズに応じた演算能力が得られるようにもしている。さらに、モデルなどの成果物はSAS Viyaでデータ管理やガバナンスで活用し、オペレーションに展開できる。AI開発者が自身の使い慣れた言語や開発環境を選べるようにすることで、AIモデル構築に伴う作業が効率化すると同時に、より創造性の高いことに集中できるようにもなる。