2024年12月17日、DataRobotは、生成AIと予測AIの開発を支援する、大規模および非構造化データの準備と処理機能を発表した。
この新機能と強化機能により、AIチームはモデル作成までの時間を短縮し、質の高いアウトプットを得ることができ、コストの最適化も実現すると同社は述べる。詳細は以下のとおり。
「AI-Readyデータ」の準備を加速
- データ品質の評価、修復、改善の自動化:自動化されたデータ品質レポート、バイアス検出、時系列、画像データ、テーブルデータに特化した特徴量エンジニアリングとテクニックの自動化を実現。手動でのデータ準備が不要になる
- 関係性の自動検出:データセット間の類似した特徴量を自動的に検出して結合。新しい特徴量を発見し、複雑さを軽減することで、反復的なコーディングや複雑なコーディングなしでトレーニングデータセットを構築する
より質の高いRAGを生成
- 生成AI対応データ:組み込みのOCR(光学式文字認識)を使用し、非構造化ドキュメントを生成AI対応データに自動的に変換
- ベクトルデータベースによるLLMレスポンス:メタデータを含むインデックス化、テキストのセマンティックチャンキング機能、複雑なクエリに対するマルチステップ検索、チャット履歴に基づくクエリ書き換えなどの技術を提供。データ検索を高速化し、応答精度を向上させる
効率的にスケールし、コストを最適化
- 増分学習機能で、モデルを大規模に構築:大規模なデータセットへの過学習を回避しながら、データを反復処理。すべてのデータ型に対応する増分学習を行う
- 様々なワークフローに適応:「NVIDIA AI Enterprise ソフトウェアプラットフォーム」に含まれる、GPUに最適化された「NVIDIA RAPIDS AIライブラリ」などのツールへの接続を提供
- 展開のスケール:NVIDIA AI Enterpriseの一部である「NVIDIA NIM マイクロサービス」を導入。開発時間を短縮し、反復作業を削減する
【関連記事】
・DataRobotが「Enterprise AI Suite」発表 生成AIアプリの開発・提供を支援
・Nutanix、DataRobot、日立システムズ3社がオンプレ生成AIソリューション提供に向け協業
・DataRobot、生成AIソリューション向けAIガードレールを発表 リアルタイム介入機能など備わる