富士通研究所は、超高圧縮した映像からでも高精度に映像の内容を認識できる、映像圧縮技術を開発したことを発表した。
今回、独自開発したAI技術「DeepTwin」を特徴量圧縮に適用することで、認識率の劣化を一定値に抑えながら、圧倒的な圧縮効率を達成できたとしている。
具体的には、AI認識モデルの一種であるVGG16を用い、映像に映っている物体を汎用的な用途として100カテゴリに分類するタスクに対して本技術を適用した場合、非圧縮の認識率から5%劣化するときの、H.265を用いた画像ベースの方法と比較して、100倍の圧縮性能を達成できたという。
例えば、自動車やトラック、オートバイといった車両の分類など特定用途を想定して20カテゴリに分類する場合には、300倍の圧縮性能となり、いずれの認識劣化量の場合においてもH.265ベースの方式と比較して高い圧縮性能を達成している。
本技術を活用することで、今後の画像認識AIソリューションの発展によるデータ量増加を抑制し、限りある通信資源の効率的な利用を可能とし、より持続可能な社会の実現に貢献するとしている。