腾讯开源视频生成新工具,论文还没发先上代码的那种

量子位
325次浏览

支持文本图像视频输入r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

先上代码再发论文,腾讯新开源文生视频工具火了。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

名为MuseV,主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

老规矩,先看效果。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

静态的金克丝秒秒钟就能动起来朝你抛媚眼:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

画中诗圣也“活”了过来:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

各种风格都能驾驭,风景图也不在话下:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

更有搞笑风《微笑的骑士》:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

再上难度,复杂些的弹唱也处理得比较自然:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

此外,加入“骨架”控制动作、姿势也可以:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

腾讯这次论文还没发直接放出训练好的模型和部署运行的代码的操作让网友眼前一亮。主页显示训练代码也即将推出。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不少人已趁热码住,GitHub获星500+。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

还有网友已经玩上了:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

围观网友直呼距离成为视频达人只差一个AI。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

嘴唇也能同步

除了直接放出模型代码,目前MuseV还有demo可体验。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

demo界面有两种玩法。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一种可以上传一张图然后加上Prompt在这张图的基础上进行视频生成;另一种是上传一个参考视频和一张图,使图片中的内容按照视频中的动作运动起来。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

紧接着下方还有一些参数可以调整。可以自定义视频的时长以及视频的尺寸。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

此外值得一提的是,文本、图像到视频的生成结果的所有帧直接由MuseV生成,没有时序超分辨、空间超分辨等任何后处理。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而输入视频控制姿态的生成模式下,开发团队表示需要参考视频的首帧条件和参考图像的首帧条件对齐,不然会破坏首帧的信息,效果会更差。所以一般生成流程是:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  • 确定参考视频;
  • 用参考视频的首帧走图生图、controlnet流程,可以使用MJ等各种平台;
  • 拿第二步中的生成图、参考视频用MuseV生成视频。
腾讯开源视频生成新工具,论文还没发先上代码的那种

除MuseV,开发团队还表示即将发布一个实时高质量的唇同步模型——MuseTalk,可与MuseV一起搭配使用。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

MuseV里面长啥样?

技术方面,据了解MuseV是在去年7月左右基于扩散模型实现的技术进展,受到Sora启发,开发团队决定开源MuseV,之后将转向扩散+Transformer方案。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

也就是说,MuseV是基于扩散模型的虚拟人视频生成框架r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

模型架构如下图所示:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

总的来说,MuseV具有以下特点:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

首先是支持使用新颖的视觉条件并行去噪方案进行无限长度生成,不会再有误差累计的问题,尤其适用于固定相机位的场景。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

并行去噪算法示意图如下:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

腾讯开源视频生成新工具,论文还没发先上代码的那种

其次,MuseV提供了基于人物类型数据集训练的虚拟人视频生成预训练模型。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而且支持图像到视频、文本到图像到视频、视频到视频的生成;兼容Stable Diffusion文图生成生态系统,包括base_model、lora、controlnet等。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

还支持多参考图像技术,包括IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID。r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

参考链接:r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
[1]https://github.com/TMElyralab/MuseVr0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
[2]https://twitter.com/Gorden_Sun/status/1774825159939256678r0A速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4575-0.html腾讯开源视频生成新工具,论文还没发先上代码的那种

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

6.98~8.58 万元,比亚迪海鸥荣耀版车型上市:纯电续航 305 405km
3 月 6 日消息,比亚迪海鸥荣耀版今日起上市,官方指导价为 6.98~8.58 万元,之前的版本为 7.38-8.98 万元。活力版 6.98 万元自由版 7.58 万元飞翔版 8.58 万元整理新车参数如下:尺寸:长宽高 3780×1715×1540mm,轴距
法拉第未来起诉高合汽车:要求丁磊及华人运通赔偿损失
  贾跃亭旗下法拉第未来起诉高合汽车:要求丁磊及华人运通赔偿损失  风雨飘摇中的高合汽车被贾跃亭旗下法拉第未来起诉。  3月5日,法拉第未来(FF)公告称,FF及其中国子公司以侵犯商业秘密和不正当竞争为由,向中国广东
岚图CEO回应:央企新能源汽车单独考核
近日,全国两会上,国务院国资委主任张玉卓表示,新能源汽车,国有汽车企业在这方面发展还不够快,我们调整政策,对三家中央汽车企业,进行新能源汽车业务的单独考核。对此,东风集团旗下岚图汽车CEO卢放表示,“单独考核”政策对
马斯克回应:特斯拉柏林工厂人为纵火停产
3月5日,德国当地环保人士疑似纵火一座高压输电塔,导致特斯拉德国柏林超级工厂因停电被迫停产,导致当天有千台特斯拉汽车未完工,此次停电预计会给特斯拉造成高达数亿欧元的损失。对此,特斯拉CEO马斯克在社交媒体上回应
吉利银河 E8 性能版车型开启交付:22.88 万元,3.49 秒破百、续航 620km
3 月 8 日消息,今晚,吉利银河 E8 的 620km 星舰性能版车型正式开启交付,其售价为 22.88 万元。吉利银河 E8 已经于今年 1 月上市,提供 5 种不同配置,售价区间为 17.58 万-22.88 万元。该车前脸采用了涟漪美学设计
采用纯视觉智驾 极越获L3自动驾驶测试牌照
近日,极越获颁中国光谷首张L3自动驾驶测试牌照,可在指定区域开展有条件的自动驾驶道路测试。极越将持续提升智能驾驶研发的创新力和硬实力,同时也将助力武汉市在智能驾驶领域的发展和示范应用的落地。  2023年1月,

热点精选

最新推荐

您可能感兴趣