IEEE:GPU很好,但不是唯一

量子位
328次浏览

CPU价值重新被发现0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这是去年大语言模型大火之时,权威期刊IEEE Spectrum在一篇文章中,开门见山给出的一个观点;并且是由一群AI研究人员得出、声量越来越大的那种。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

IEEE:GPU很好,但不是唯一

文章还坦言道:0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

例如文章引援了Hugging Face首席布道官Julien Simon体验的真实案例——0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

拿一个英特尔® 至强® 系列CPU,就能轻松驾驭Q8-Chat这个大语言模型,而且响应速度很快。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Simon对此开诚布公地表示:0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而这也正与当下大模型的发展趋势变化相契合,即逐渐从训练向推理倾斜,大模型不再仅仅较真于参数规模、跑分和测评,更注重在应用侧发力。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一言蔽之,比的就是看谁能“快好省”地用起来。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不过话虽如此,但在真实的AI场景中,CPU真的已经“支棱”起来了吗?0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

京东云,选择CPU

如果说当时在这个话题上,IEEE扮演了 “嘴替”,是在帮那些AI应用实践的先行者们发声,那么这种发声,确实又吸引或带动了更多实干者来验证这种可行性。他们如今已经可以给出一个确定答案,即在很多AI推理的场景中,CPU已经能很好地上岗了。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

例如中国公有云服务器市场的翘楚京东云,它pick的便是最新的第五代英特尔® 至强® 可扩展处理器0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

具体而言,是在其新一代京东云服务器上搭载了这款高端CPU。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

话不多说,我们直接先来看下效果。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

IEEE:GPU很好,但不是唯一

首先,从整体来看,新一代京东云服务器的整机性能最高提升了23%!0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

除此之外,在AI推理方面的性能也是Up Up Up。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  • 计算机视觉推理:性能提升38%
  • Llama 2推理:性能提升51%

而之所以能有如此突破,核心就是第五代英特尔® 至强® 可扩展处理器内置的AMX(高级矩阵扩展)技术对AI的加速能力。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

英特尔® AMX是针对矩阵运算推出的加速技术,支持在单个操作中计算更大的矩阵,让生成式 AI 更快地运行。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一言以蔽之,你可以把它当作内置在CPU中的Tensor Core。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

展开来说, AMX引入了一种包含两个组件的新矩阵处理框架,包括二维的寄存器文件,它由被称为“tile”的寄存器组成;另一个是一系列能够在这些tile上执行操作的加速器。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在这些技术的加持之下,以向量检索为例,当处理n个批次的任务时,需要对n个输入向量x和n个数据库中的向量y进行相似度比较。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这一过程中的相似度计算涉及到大量的矩阵乘法运算,而英特尔® AMX能够针对这类需求提供显著的加速效果。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

IEEE:GPU很好,但不是唯一

△英特尔® AMX架构0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在提升模型性能的过程中,英特尔® oneDNN作为AMX的软件搭档,可为操作者提供一种高效的优化实现方式。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

开发者仅需调用MatMul原语,并提供必要的参数,包括一些后处理步骤,oneDNN便会自动处理包括配置块寄存器、数据从内存的加载、执行矩阵乘法计算以及将结果回写到内存等一系列复杂操作,并在最后释放相关资源。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这种简化的编程模式显著减轻了工程师的编程负担,同时提升了开发效率。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

通过上述软硬结合的优化措施,京东云新一代服务器就可以在大模型推理和传统深度学习模型推理等场景里提供能满足客户性能和服务质量 (QoS) 需求的解决方案,同时还可以强化各种CPU本就擅长的通用计算任务的处理效率。仅就大家关心的大模型推理而言,已经能用于问答、客服和文档总结等多种场景。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

IEEE:GPU很好,但不是唯一

△Llama2-13B推理性能测试数据0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而且除了性能上的优化之外,由于搭载了英特尔® AMX等模块,新一代京东云服务器也可以更快地响应中小规模参数模型,把成本也狠狠地打了下去。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

你以为这就结束了?英特尔CPU给新一代京东云服务器带来的好处,可不只涉及推理加速和成本,更可靠的安全防护也是其独到优势之一。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

基于新款处理器内置的英特尔® Trust Domain Extension(英特尔® TDX)技术,京东云在不改变现有应用程序的情况下,就能构建基于硬件设备的可信执行环境(Trusted Execution Environment,TEE)。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

英特尔® TDX通过引入信任域(Trust Domain,TD)虚拟环境,利用多密钥全内存加密技术,实现了不同TD、实例以及系统管理软件之间的相互隔离,让客户的应用和数据与外部环境隔离,防止未授权访问,且性能损耗较低。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

总的来说,英特尔CPU上的这项技术,是从硬件、虚拟化、内存到大模型应用等多个层面,为新一代京东云服务器的数据和应用保密提供了可靠支撑。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

重新发现CPU的价值

AI进入2.0时代,所有应用都值得重写一遍已逐渐成为共识。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

如果站在算力基础设施的视角重新审视这场变革,还能发现这样一个新趋势:推理算力越来越被重视起来。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

也就是随着大模型应用场景的日益丰富,对推理阶段的性能要求也变得更高和多样化。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一方面,实时性强、时延敏感的终端侧场景需要尽可能短的响应时间;0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

另一方面,并发量大、吞吐量高的云端服务则需要强大的批处理能力。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

与此同时,面向不同硬件平台、网络条件的推理适配也提出了更复杂甚至带有不同前置条件的要求。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

如此一来,此前在硬件上的单一“审美观”就被改写,本来就主攻通用计算、能在整个AI的协同编排中扮演重要角色,又能撸袖子自己上、兼顾AI加速,同时还有更多“才艺”、应用适配也更为灵活,相比GPU或专用加速芯片获取更容易,且已部署到无处不在的CPU,其价值也被重新发现,这一切都顺理成章。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

相信随着软硬件适配的不断深入,以及云边端协同的加速落地,CPU还有望在AI,特别是AI推理实践中找到更多的用武之地,发挥更大的应用潜力。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

可以预见,高性能、高效率、高适应性的CPU,在大模型越来越卷的时代,依旧是个可靠的选择。这一点,会有更多人因为实践,从而见证。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

最后让我们打个小广告:为了科普CPU在AI推理新时代的玩法,量子位开设了《最“in”AI》专栏,将从技术科普、行业案例、实战优化等多个角度全面解读。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

我们希望通过这个专栏,让更多的人了解CPU在AI推理加速,甚至是整个AI平台或全流程加速上的实践成果,重点就是如何更好地利用CPU来提升大模型应用的性能和效率。0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

— 完 —0Kw速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4437-0.htmlIEEE:GPU很好,但不是唯一

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

8.98 万起,五菱缤果 PLUS 车型上市:401km 510km 续航
3 月 6 日消息,五菱汽车官宣五门纯电 SUV 五菱缤果 PLUS 上市,新车款型为 401km 旗舰版和 510km 旗舰版,官方指导价分别为 8.98 万元、9.88 万元。五菱缤果 PLUS 号称搭载高效智能热管理系统和智慧能量管理,1 度
国资委:将对三家中央车企进行单独考核
3月5日,十四届全国人大二次会议首场“部长通道”在人民大会堂举行。国务院国有资产监督管理委员会党委书记、主任张玉卓受邀接受采访时表示,今年中央企业将聚焦“高”“质”“量”发展, 加快推进中央企业高水平的协
绿美广东|广东十二部门联合发文,全面加强野生植物保护工作
南方财经全媒体见习记者林鹏 实习生 张梦琦 辛瑞 广州报道日前,南方财经全媒体记者从广东省林业局获悉,《关于进一步加强野生植物保护管理工作的通知》(以下简称《通知》)正式发布,明确
零跑汽车朱江明:零跑国际高管团队现已到位
近日,零跑与Stellantis合资公司的最新进展曝光,零跑汽车创始人、董事长、CEO朱江明在社交平台发布动态:“零跑国际以最快的速度建立了高管团队,个个是行业的精英,零跑的海外业务一定超越大家的期待!”。  作为回顾,在2
“新能源汽车第一城”再易主,深圳大幅超车,还有这些城市在踩油门
  “新能源汽车第一城”再易主,深圳大幅超车,还有这些城市在踩油门  2023年各地新能源汽车产量陆续公布,深圳首次登上全国第一的宝座,上海、西安分列二三位。  由此,最近三年的“新能源汽车第一城”三度易主,2021年、
一代神车消逝记,福克斯为何一步步走向市场边缘?
有数据显示,2024 年 1 月,福克斯的销量仅为 2 辆,听到这一消息,让笔者感到一阵唏嘘。福克斯,对于许多 80 后、90 后来说,即使没有开过这款车,也一定听过这个名字,它操控性强、性能充沛、运动属性拉满,曾是很多年轻人首

热点精选

最新推荐

您可能感兴趣