北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

量子位
388次浏览

提出基于深度学习的传统-智能混合解决方案Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着以深度学习为代表的新一代人工智能技术不断取得突破,学术界与工业界逐渐意识到人工智能技术在图像、视频压缩领域的巨大应用潜力。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

基于深度学习的图像视频压缩技术被视为超越传统压缩技术能力极限、取得突破性进展的明日之星。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

近日,第六届深度学习图像压缩挑战赛(以下将简称“CLIC大赛”)比赛结果公布,由火山引擎多媒体实验室与北大组成的联合参赛平台b-2在高码率视频压缩低码率视频压缩两个赛道均夺得主客观指标冠军。基于深度学习技术,b-2平台提出了一项“传统-智能混合解决方案”。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

传统—智能混合解决方案

b-2 平台在充分理解传统压缩技术与深度学习压缩技术的各自原理的基础上,发挥两种技术路线的各自优势,取长补短,将二者有机融合成为一个整体,形成了独具特色的传统——智能混合解决方案。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

传统编码模块在业界已有传统编码框架基础上,加入了非对称四叉树划分等创新技术。智能编码模块则引入了基于深度学习的环路滤波等技术。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

△非对称四叉树划分结构;(a)H1型水平UQT,(b)H2型水平UQT,(c)V1型垂直UQT,(d)V2型垂直UQT。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

编码单元划分是混合视频编码框架的基础,决定着编码单元的基本形状和尺寸。灵活的划分方法能更有效地表达视频丰富的纹理和运动,对编码性能的提升起着至关重要的作用。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

团队提出了非对称四叉树 (UQT) 划分结构,旨在提高视频的编码效率。与现有的四叉树(Quad Tree, QT),二叉树(Binary Tree, BT),三叉树(Ternary Tree, TT)划分结构相比,UQT通过一次划分生成的子编码单元能触及更深的划分深度,能更有效地捕捉视频丰富的细节特性。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

此外,UQT生成的子块形状是无法通过 QT 、BT、TT组合实现的,一定程度上弥补了现有划分的不足,丰富了划分的表达。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

△环路滤波网络结构示意图,包括网络的输入,滤波与输出模块Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

传统视频编码中采用环路滤波器去除编码失真,缩小原始图像与重建之间的失真,例如经典的去块滤波、样本自适应偏移和自适应环路滤波等。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

参赛平台提出了一种基于残差卷积网络的增强型环路滤波技术,有机地将环路滤波技术与深度学习技术结合在一起,在网络结构中与模型训练中充分利用传统视频编码的先验信息,提升环路滤波效率。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

网络输入方面,除重建像素外,团队将编码过程中的预测信息、划分信息、边界强度以及量化参数等作为增强信息供深度网络学习,丰富先验知识,使得网络能更好地感知压缩失真。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在分层参考的编码结构中,待编码帧将参考已重建的高质量帧。团队提出对不同时域层次帧所使用的滤波器采用迭代训练的方式,获取最接近真实编码的训练数据,实现更高性能的滤波。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

此外,每个条带及最大编码单位均可以在多个滤波模型中自适应地选择率失真性能最优的网络模型,并将选择信息传输到解码端。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

△CLIC视频压缩赛道基于MOS的排行榜Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

CLIC大赛由电气与电子工程师协会IEEE主办,从诞生开始就获得了学术界与工业界的广泛关注。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

2023年CLIC大赛暂停一届,本届大赛依托于数据压缩领域的顶级会议 Data Compression Conference (DCC)再次举办。本届DCC中,火山引擎多媒体实验室有8篇论文入选。此外,这也是该团队自2022年CLIC大赛高码率视频压缩低码率视频压缩两个赛道夺冠后,再次蝉联。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际标准化工作,其众多创新算法及软硬件解决方案已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。实验室成立以来,多篇论文入选国际顶会和旗舰期刊,并获得数项国际级技术赛事冠军、行业创新奖及最佳论文奖。Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

— 完 —Bwo速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4656-0.html北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

“12221”创新路,广东湛江“菠萝的海”向全球采购商发出邀请信!
广东“开年第一果”——湛江徐闻菠萝于近日上市了,徐闻县委、县政府一如既往地发出了《致全球菠萝采购商的一封信》,代表湛江市徐闻县15万勤劳朴实的菠萝果农,诚挚邀请全球采购商到“中
每年投入 10 亿美元,剖析苹果汽车项目十年历程:曾计划收购特斯拉
3 月 7 日消息,马克・格尔曼(Mark Gurman)和德雷克・贝内特(Drake Bennett)合作,今天在彭博社上发表了一篇深度报道,回顾和剖析了苹果汽车项目过去 10 年的发展历程。这篇文章为付费文章,本文简要汇总了基于其它媒体
专访全国人大代表、泉州市市长蔡战胜: “晋江经验”最鲜明的特色就是咬住实体经济发展不放松
21世纪经济报道记者周慧 实习生刘龙珠 北京报道 民营经济发展是2024年全国两会上代表委员关注的热点话题。政府工作报告提出,全面落实促进民营经济发展壮大的意见及配套举措,进一步解
人社部部长王晓萍:人工智能、大数据等专业人才需求旺盛 我国就业结构性矛盾仍待破解
21世纪经济报道记者 缴翼飞 实习生 张晓慧 北京报道3月9日,人力资源和社会保障部部长王晓萍在第十四届人大二次会议的民生主题记者会上表示,过去一年我国就业局势持续改善,全年城镇新增
全国人大代表、中天科技集团董事长薛济萍:建议加大政策性开发性金融工具对南通交通枢纽重点项目支持力度
21世纪经济报道记者张梓桐 上海报道全国两会进行时,围绕区域交通的话题得到代表、委员的热议。在这其中,南通综合交通枢纽正在加快新出海口建设。2019年“规划建设南通通州湾长江集装
南财对话丨陈文玲:5%的经济增长目标是“跳一跳能摘到的桃子”
南方财经全媒体记者丁莉 北京报道日前出炉的2024年政府工作报告,将今年国内生产总值增长目标定为了5%左右。中国国际经济交流中心总经济师陈文玲认为,这一增长目标既符合实际又有一定

热点精选

最新推荐

您可能感兴趣