2025年1月21日、ファストリー(Fastly)は、AIソリューション「Fastly AI Accelerator」の一般提供を開始したと発表した。
Fastly AI Acceleratorは、大規模言語モデル(LLM)生成AIアプリケーション開発におけるパフォーマンス向上とコスト削減を支援するセマンティックキャッシュソリューション。同ソリューションは、2024年6月にOpenAIのChatGPT対応のベータ版をリリースしており、今回MicrosoftのAzure AI Foundryにもサポートを拡大したという。2024年10月15日から11月27日までのベータ版と比較すると、平均9倍速い応答時間を実現しているとのことだ。
同ソリューションにより開発者は、1行のコード変更とアプリケーションのAPIエンドポイント更新で、セマンティックキャッシュ機能を利用できるという。同社のエッジクラウドプラットフォームを活用し、繰り返しのクエリに対してキャッシュされたレスポンスを提供するとしている。
【関連記事】
・Fastly、DDoS攻撃を自動で防御するソリューションを提供開始 処理・分析・診断・対応をワンクリックで
・ハイテク業界を対象としたサイバー攻撃が37%で最大、メディア・金融業界が後に続く──Fastly調査
・Fastly、LLMパフォーマンス向上できる新サービス開始 セマンティックキャッシュで機能向上へ