富士通研究所は、超高圧縮した映像からでも高精度に映像の内容を認識できる、映像圧縮技術を開発したことを発表した。
今回、独自開発したAI技術「DeepTwin」を特徴量圧縮に適用することで、認識率の劣化を一定値に抑えながら、圧倒的な圧縮効率を達成できたとしている。
具体的には、AI認識モデルの一種であるVGG16を用い、映像に映っている物体を汎用的な用途として100カテゴリに分類するタスクに対して本技術を適用した場合、非圧縮の認識率から5%劣化するときの、H.265を用いた画像ベースの方法と比較して、100倍の圧縮性能を達成できたという。
例えば、自動車やトラック、オートバイといった車両の分類など特定用途を想定して20カテゴリに分類する場合には、300倍の圧縮性能となり、いずれの認識劣化量の場合においてもH.265ベースの方式と比較して高い圧縮性能を達成している。
本技術を活用することで、今後の画像認識AIソリューションの発展によるデータ量増加を抑制し、限りある通信資源の効率的な利用を可能とし、より持続可能な社会の実現に貢献するとしている。

[画像クリックで拡大]
この記事は参考になりましたか?
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア