开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> JVET-X基于神经网络视频编码实验总结 -> 正文阅读

[人工智能]JVET-X基于神经网络视频编码实验总结

本文来自JVET-X0023《EE1: Summary of Exploration Experiments onNeural Network-based Video Coding》

本提案是JVET-X EE1的实验总结，EE1是基于神经网络的视频编码的实验。包含了在W次会议到X次会议间完成了11个NNVC的技术实验，及它们的性能和复杂度分析。基于NN的环路滤波的几种变种技术在RA配置下码率节省2~10%，复杂度30~800kMAC/pxl（每个像素的平均累加乘法操作数）。几种基于NN的超分辨技术对4K内容在RA配置下平均节省1~6%。完成了基于NN的帧内预测跨平台实现和交叉验证，帧内编码性能提升3%以上。

测试条件和评价指标

EE1的实验条件和评价指标和AGH11相同。anchor是VTM11.0，开启基于GOP的时域滤波。QP={22,27,32,37,42}。需要注意的是，超分辨的技术离目标码率还很远，所以其RD曲线相比其他技术的没那么可靠。

客观实验结果总结

表1是RA配置下的客观实验结果。

其中NN-filters表示基于NN的滤波技术提案的结果，Super Res表示基于NN的超分辨提案的结果，NN-Intra表示基于NN的帧内预测提案的结果。各列的含义为，Total CONV表示卷积层数，Total memory MB表示模型占用空间大小，kMAC/pxl表示平均每个像素累加乘法操作数用于衡量复杂度，Precision表示模型精度F表示浮点精度、int16表示16位整数精度。

由表1实验结果可得出以下结论：