我国大模型成果首次登上《自然》正刊

北京青年报
36次浏览

近日,北京智源人工智能研究院的多模态大模型成果“通过预测下一个词元进行多模态学习的多模态大模型”上线国际顶级学术期刊《自然》,预计2月12日纸质版正式刊发,这是我国科研机构主导的大模型成果首次在《自然》正刊发表。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

2018年以来,GPT采用“预测下一个词元(NTP)”的自回归路线,实现了语言大模型重大突破,开启了生成式人工智能浪潮。而多模态模型主要依赖对比学习、扩散模型等专门路线,自回归路线是否可以作为通用路线统一多模态?一直是未解之谜。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

智源研究院提出的Emu3模型,基于“预测下一个词元”的全新多模态模型,将图像、文本和视频统一离散化到同一个表示空间中,并从零开始,在多模态序列混合数据上联合训练一个单一的Transformer。这一架构证明了仅凭“预测下一个词元”,就能够同时支持高水平的生成能力与理解能力,并且在同一统一架构下,自然地扩展到机器人操作以及多模态交错等生成任务。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

实验显示,Emu3在生成与感知任务上的整体表现可与多种成熟的任务专用模型相媲美:在文生图任务中,其效果达到扩散模型水平;在视觉语言理解方面,可以与融合CLIP和大语言模型的主流方案比肩。此外,Emu3还具备视频生成能力。不同于以噪声为起点的扩散式视频生成模型,Emu3通过自回归方式逐词元(token)预测视频序列,实现基于因果的视频生成与延展,展现出对物理世界中环境、人类与动物行为的初步模拟能力。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这项成果表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型,对于确立自回归成为生成式人工智能统一路线具有重大意义。值得一提的是,智源研究团队对相关研究的多项关键技术与模型进行了开源,以推动该方向的持续研究。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

《自然》编辑点评这项研究:Emu3仅基于预测下一个词元,实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

近日,北京智源人工智能研究院的多模态大模型成果“通过预测下一个词元进行多模态学习的多模态大模型”上线国际顶级学术期刊《自然》,预计2月12日纸质版正式刊发,这是我国科研机构主导的大模型成果首次在《自然》正刊发表。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

2018年以来,GPT采用“预测下一个词元(NTP)”的自回归路线,实现了语言大模型重大突破,开启了生成式人工智能浪潮。而多模态模型主要依赖对比学习、扩散模型等专门路线,自回归路线是否可以作为通用路线统一多模态?一直是未解之谜。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

智源研究院提出的Emu3模型,基于“预测下一个词元”的全新多模态模型,将图像、文本和视频统一离散化到同一个表示空间中,并从零开始,在多模态序列混合数据上联合训练一个单一的Transformer。这一架构证明了仅凭“预测下一个词元”,就能够同时支持高水平的生成能力与理解能力,并且在同一统一架构下,自然地扩展到机器人操作以及多模态交错等生成任务。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

实验显示,Emu3在生成与感知任务上的整体表现可与多种成熟的任务专用模型相媲美:在文生图任务中,其效果达到扩散模型水平;在视觉语言理解方面,可以与融合CLIP和大语言模型的主流方案比肩。此外,Emu3还具备视频生成能力。不同于以噪声为起点的扩散式视频生成模型,Emu3通过自回归方式逐词元(token)预测视频序列,实现基于因果的视频生成与延展,展现出对物理世界中环境、人类与动物行为的初步模拟能力。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这项成果表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型,对于确立自回归成为生成式人工智能统一路线具有重大意义。值得一提的是,智源研究团队对相关研究的多项关键技术与模型进行了开源,以推动该方向的持续研究。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

《自然》编辑点评这项研究:Emu3仅基于预测下一个词元,实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。Fs3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-15087-0.html我国大模型成果首次登上《自然》正刊

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

比亚迪混动 + 华为车机,赛力斯中型 SUV 蓝电 E5 推出限时优惠:9.98 万元起
3 月 5 日消息,赛力斯集团旗下车型蓝电 E5 日前推出限时优惠政策,3 月 1 日起新车现金最高直降 4.01 万元,限时抢购价 9.98 万元起,活动时间截至 6 月 30 日。该车已于去年 3 月 30 日上市,在售车型为原价 13.99
将可城可野 全新一代北京BJ30官图发布
3月6日,从北京汽车官方获取到了旗下轻越野SUV——BJ30车型官图。作为“悦旅”系列的首款车型,该车将搭载魔核混动、超级电四驱等配置。同时,该车已于此前完成申报,采用当下流行的“方盒子”造型,整体看上去硬朗且时尚
马斯克回应:特斯拉柏林工厂人为纵火停产
3月5日,德国当地环保人士疑似纵火一座高压输电塔,导致特斯拉德国柏林超级工厂因停电被迫停产,导致当天有千台特斯拉汽车未完工,此次停电预计会给特斯拉造成高达数亿欧元的损失。对此,特斯拉CEO马斯克在社交媒体上回应
全国人大代表、沈阳市于家台村总书记佟亮:加强农村直播带货基础设施建设
21世纪经济报道记者周慧 北京报道农村居民如何更好的就业和增收?全国人大代表、辽宁省沈阳市辽中区潘家堡镇于家台村党总支书记佟亮,提出了《关于发挥好直播带货的作用 促进农民就业
高合汽车创始人丁磊:将提起贾跃亭侵犯名誉权诉讼
  中新经纬3月5日电 3月5日,高合汽车官方微博发布创始人丁磊的声明称,丁磊本人及华人运通/高合汽车将向法院提起贾跃亭侵犯名誉权的相关诉讼,澄清事实。  来源:高合汽车官方微博  丁磊在声明中表示,其个人在乐视任职
日本漫画家鸟山明逝世 外交部:深切哀悼
中国外交部今天(8日)举行例行记者会。会上,有记者就日本知名漫画家鸟山明因病逝世提问。对此,外交部发言人毛宁表示,我们对鸟山明先生逝世表示深切的哀悼,向他的家属表示诚挚的慰问。鸟山

热点精选

最新推荐

您可能感兴趣