2024年12月25日、カラクリは、日本語に特化した生成AIのガードレール「KARAKURI Guardrails」のβ版の提供を開始した。
KARAKURI Guardrailsは、既存のテック各社が提供するガードレール機能(有害コンテンツ検出、プライバシー保護、コンプライアンスチェックなど)に加え、日本語独自の表現や慣習に即した検知・制御を実現。また、企業固有の要件やポリシーに合わせたカスタマイズが可能で、より精緻なリスク管理と安全なコミュニケーション環境を提供するとのことだ。
主な機能は以下のとおり。
- ハルシネーションリスクの検知:AIが事実と異なる情報、根拠のない内容を生成するリスクを検出。信頼性の高い情報源と照合し、不確実な情報や矛盾する内容を特定することで、誤った情報の拡散を防ぐ
- 文脈逸脱の検知:会話やクエリの文脈を理解し、設定された主題や目的から逸脱した応答を識別。ユーザーの意図に沿った情報提供を維持し、効率的なコミュニケーションを支援する
- 攻撃的行為の検知:悪意のある入力や潜在的な攻撃パターンを識別。不適切な言葉遣い、システムの脆弱性を突こうとする試み、悪意のあるコード実行の可能性がある入力を検出し、システムとユーザーの安全を確保する
- 個人情報の検知:氏名、住所、電話番号、クレジットカード情報などの機密データを検出し、必要に応じてマスキングまたは削除。プライバシー保護とデータセキュリティを強化する
- 禁止ワード、禁止トピックの検出:組織のポリシーや法的基準に基づく禁止用語・トピックを検出。コンプライアンス対応と適切なコンテンツ管理をサポートする
【関連記事】
・カラクリ、東京海上日動と協働 生成AIを活用した照会応答業務の高度化を目指した実証実験を開始
・カラクリ、生成AI開発支援プログラム「GENIAC」に採択 AIエージェントモデルの実装進める
・武蔵野銀行、カラクリのチャットボット・FAQ統合システム導入 運用工数約50%削減、対応領域拡大へ