农企新闻网

紧缩效率第一!CVPR图像紧缩应战赛腾讯音视频实验室胜出

发布者:何楠
导读腾讯科技讯 CVPR 2018 图像紧缩应战赛(CLIC)后果曾经出炉,腾讯音视频实验室和武汉大学陈震中教授结合团队于该项应战赛上获得紧缩功能第一。CVPR是世界顶级的学术会议,自1983年第一次召开至今曾经有30多年历史,在国际学术圈有很强的影响力,每年的CVPR都是计算机视觉范畴的盛宴,全世界相关范畴的顶尖学者、研讨人员和企业都会积极参与。往年,CVPR新增了图像紧缩workshop和应战赛议

腾讯科技讯 CVPR 2018 图像紧缩应战赛(CLIC)后果曾经出炉,腾讯音视频实验室和武汉大学陈震中教授结合团队于该项应战赛上获得紧缩功能第一。

CVPR是世界顶级的学术会议,自1983年第一次召开至今曾经有30多年历史,在国际学术圈有很强的影响力,每年的CVPR都是计算机视觉范畴的盛宴,全世界相关范畴的顶尖学者、研讨人员和企业都会积极参与。往年,CVPR新增了图像紧缩workshop和应战赛议程,这场应战赛由大多数人都曾因不佳的交通状况而迟过到、叫过苦。经济的快速发展带动的是社会各方面的全面提升,但在此过程中,交通的发展却没跟得上前进的步幅,各类交通难题让交管部门伤透脑筋,如何利用AI来解决相关难题已成当务之急。Google、Twitter、Amazon等公司结合资助,是第一个由计算机视觉范畴的会议发起的图像紧缩应战赛,旨在将神经网络、深度学习等一些新的方式引入到图像紧缩范畴。

据大会官方引见,此次应战赛辨别从PSNR和客观评价两个方面去评价参赛团队的表现。腾讯音视频实验室和武汉大学陈震中教授结合团队iipTiramisu 在 PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)目标上占据抢先优势,在决赛数据集上比第二名高了0.13 dB,位列第一。在其他目标上,iipTiramisu 也位居前列。

峰值信噪比(PSNR)权衡的是紧缩前后两张图逐像素统计所发生的误差,峰值信噪比越高,代表两张图误差越小,也就意味着紧缩后的图与原图越接近、图片质量损失越小。

iipTiramisu在峰值信噪比上有明显的优势,与业界最优秀的开源图像紧缩算法之一BPG相比:


Fig.1 The Rate-PSNR curve of different encoders. (bit-rate range 0.05-0.35 bpp)

信噪比不变的状况下,在功能优先形式下iipTiramisu比BPG节省30.8%的码率,速度优先形式下比BPG节省27.9%的码率;



在码率都为0.14 bpp的状况下,iipTiramisu的峰值信噪比比BPG高1.58 dB,质量损失率分明增加。

据陈震中教授引见,iipTiramisu团队运用了基于传统混合框架(hybrid image coder)融入深度学习的编码模块CNNMC以及CNN in-loop filter,以及基于不确定性的资源分配战略,最终可以在数据集紧缩功能上比BPG提升30%以上。

iipTiramisu由腾讯音视频实验室硅谷研发中心和武汉大学陈震中教授团队结合组成。 陈震中教授是武汉大学教授、博导,青年千人,次要从事计算机视觉、图像视频处置、人机交互、数据发掘等方向的研讨,近年来宣布国际期刊会谈论文120多篇,拥有50余项国际国际规范(H.265/HEVC/AVS)提案、10余项国际国际专利请求或受权。腾讯音视频实验室和陈震中教授团队在图像视频处置、人工智能等范畴展开了深化的协作。

图像紧缩技术关于互联网信息传输有至关重要的意义。一张未经紧缩的 1200 万像素的图片就会占用 36MB 的存储空间,而目前网络上每天图片传输、存储数量数以亿万计,为了节省带宽资源、存储资源,增加效劳器的压力,高效的图像紧缩算法必不可少。

腾讯音视频实验室在图像紧缩范畴有很深的积聚,去年5月,该实验室推出了一种基于AVS的自研图片格式TPG,其紧缩效率也明显抢先于JPG/JPEG、PNG、GIF、WEBP等主流的图片格式,处于世界抢先程度。往年5月,TPG还由于在AVS规范制定和推行中做出的突出奉献,取得了AVS任务组颁发的年度AVS产业技术创新奖。此次取得CVPR 2018图像紧缩应战赛紧缩效率第一,意味着腾讯音视频实验室在图像紧缩范畴又获得了一个长足的提高。