基于学习的视频压缩和视频分析任务在学术界和工业界蓬勃发展,对于相关研究工作和标准制定工作急需高质量的训练和测试数据,例如对于JPEG AI、JVET NNVC、MPEG VCM等。因此,腾讯多媒体实验室构建了TVD(Tencent Video Dataset)数据集。
TVD可以用于多种任务,例如基于神经网络的视频编码、目标检测、目标追踪等。
TVD包含86个视频序列,涵盖了不同内容。每个序列分辨率为3840x2160,有65帧。这些视频序列已经用于JVET NNVC相关提案的训练。
对于目标检测任务,TVD提供了166个1920x1080的图像,RGB24格式,并且标定了bounding box。同时为了实例分割任务,还为这166个图像提供了segmentation masks annotations。
对于目标追踪任务,提供了3个视频和对应label,这些视频已经包含在MPEG VCM的测试集中了。
下图是一些序列的缩略图,
TVD的下载链接为:https://multimedia.tencent.com/resources/tvd
也可后台回复“TVD”获取下载链接
References X. Xu, S. Liu and Z. Li, "A Video Dataset for Learning-based Visual Data Compression and Analysis", 2021 International Conference on Visual Communications and Image Processing (VCIP) X. Xu, S. Liu and Z. Li, "Tencent Video Dataset (TVD): A Video Dataset for Learning-based Visual Data Compression and Analysis", arXiv:2105.05961, May 2021. X. Xu, et al. "A video dataset for training in neural network based video coding", JVET-U0116, ITU-T SG 16 Q6 and ISO/IEC JTC 1/SC 29 document, Jan. 2021.?
感兴趣的请关注微信公众号Video Coding
?
|