自研高速网络会成为算力集群的下一战场吗?

界面新闻
21次浏览

从硬件性能追赶到生态体系成熟,国产替代之路仍然漫长。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在算力集群的规模竞赛迈向十万卡的过程中,围绕高速网络的技术竞赛正在浮出水面。中科曙光近日发布高速网络方案ScaleFabric,试图补上国产算力产业链长期缺失的一环。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“网络可靠性是未来的重点。”中科曙光高级副总裁李斌对界面新闻等媒体表示,算卡集群从万卡到十万卡做突破,最核心的技术不是来自于计算节点,而是来自于互联系统,来保证规模扩大后本身效率的可扩展。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这一判断指向了AI算力基础设施正在改变的事实:当GPU芯片的竞争已经白热化,将数以万计的芯片高效串联、协同的网络能力,正在成为决定算力集群性能的又一关键变量。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一个大规模算力集群的构建分为两层。第一层是纵向扩展(Scale-up),在单台服务器或单机柜内集成大量GPU及AI芯片,通过高速互联形成超级计算节点;第二层是横向扩展(Scale-out),通过高速网络将这些节点串联成集群。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在纵向扩展层面,一场围绕超节点卡数的竞赛正在展开。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

2026年1月,英伟达发布第六代NVLink以及NVLink Switch,两者支持最新的Rubin架构,目前商用最大支持72张XPU卡。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国内厂商则推行得相对激进。在中国半导体制造工艺相对落后的背景下,Scale-up被视为通过堆叠更多卡数来规避单一芯片性能不足的替代方案。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据界面新闻此前报道,华为昇腾通过在超节点互联技术上强力投资,发力走“集群规模化”路线,试图凭借这一方向“做到世界上算力最强”,推出了配备384张昇腾AI加速卡的华为昇腾384超节点真机。瞄准类似目标,沐曦推出了连接64张曦云C550通用GPU的超节点产品耀龙S8000 G2。中科曙光在2025年12月也推出了单机柜640卡的scaleX640超节点。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一名从业人士告诉界面新闻,影响超节点内部的串联效率和协同的主要因素是Scale-up协议,互联芯片延迟和带宽;华为昇腾384是现在量产的超节点产品中卡数最多的方案,中科曙光的640卡方案目前尚未量产。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但无论超节点规模最终稳定在何处,它们共同指向了同一瓶颈:节点内芯片越多,节点之间的网络压力就越大。这也带来了高速互联快速膨胀的市场。李斌表示,相比原来的数据中心高速网络的用量,基本上提高了10到20倍,“从网络端口就可以看到市场的增量”。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这恰恰是横向扩展——也是ScaleFabric所瞄准的市场。在横向扩展中,让大量节点高效协同的核心技术是RDMA(远程直接内存访问)。这一技术绕过CPU和操作系统,让机器之间直接读写内存,而这带来的低延迟对AI大模型的训练和推理至关重要。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

实现RDMA有两条主流路线。InfiniBand原生支持RDMA,无需CPU参与即可在系统间进行直接内存传输。英伟达在2019年以69亿美元收购Mellanox后,就牢牢把控了这一高性能网络技术市场,凭借其硅芯片设计专业、自研高速互连和网络技术及CUDA,形成了一套生态内的闭环。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

另一条路线是RoCE(融合以太网上的RDMA),将RDMA功能嫁接到标准以太网上,成本更低、生态更开放,但需要复杂配置才能接近无损效果。Google、Meta等部分海外科技公司及国内互联网大厂均有所采用。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在InfiniBand目前仍是AI高性能网络标杆的背景下,中国公司面临的问题是,这条路线的核心供应被一家美国公司垄断。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在这一背景下,中科曙光选择不走被更多国内厂商采用的RoCE路线,而是自研一套基于InfiniBand技术理念的方案。中科曙光高速网络互联产品部总工程师万伟的解释是,基于在高性能计算的经验,其认为InfiniBand的技术路线在AI和HPC(高性能计算)中有不可替代的优势;作为真正的无损网络,其无损特性对RDMA性能的发挥至关重要。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据界面新闻了解,中科曙光此次发布的ScaleFabric核心是InfiniBand网络的设计思路,可以看作是基于InfiniBand技术的一种优化。作为国内首款原生无损RDMA高速网络方案,ScaleFabric涵盖了从交换芯片、网卡到交换机、驱动与管理软件的完整自研体系。万伟透露,其端到端通信时延的能力上限已做到0.9微秒。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在商业策略上,ScaleFabric试图在英伟达的技术理念与国产自主可控之间找到平衡点。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该系统在定位上对标英伟达Infiniband,系统结构保持透明,通过标准SIP网络接口支持不同计算芯片的互联与适配。在此基础上,团队正在探索让计算芯片通过专有协议直通网卡,同时推动芯片间互联协议的共享,为与其他厂商的计算芯片实现高效直连铺路。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但曙光并不打算将自己锁定在单一协议上。李斌透露,未来的技术路线将探索不同协议的融合,可能在原生RDMA的基础上做不同网络路线的兼容。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

ScaleFabric的意义,或许不在于正面超越英伟达,而在于提供一条国产自主可控的替代路径。李斌对界面新闻表示,中科曙光期待在InfiniBand的技术路线能实现技术上的国产化替代,包括实现业务上真正的市场占比替代。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但技术指标上的接近,与产业生态的成熟之间,仍隔着一段不短的路程。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

北京科技大学高性能计算领域专家储根深对界面新闻表示,国产计算硬件发展总体落后英伟达一到两代,“更难的是上面的生态”。英伟达围绕InfiniBand构建了多年的产业生态,并非单靠硬件性能对标就能复制。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

ScaleFabric目前已在位于郑州的国家超算互联网核心节点三万卡智算集群中进行了部署验证,但更大规模的产业化落地仍需时间。从单一集群内的验证到成为市场上被广泛选择的方案,这条突围之路,可能比单纯的芯片研发周期更为漫长。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

从硬件性能追赶到生态体系成熟,国产替代之路仍然漫长。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在算力集群的规模竞赛迈向十万卡的过程中,围绕高速网络的技术竞赛正在浮出水面。中科曙光近日发布高速网络方案ScaleFabric,试图补上国产算力产业链长期缺失的一环。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“网络可靠性是未来的重点。”中科曙光高级副总裁李斌对界面新闻等媒体表示,算卡集群从万卡到十万卡做突破,最核心的技术不是来自于计算节点,而是来自于互联系统,来保证规模扩大后本身效率的可扩展。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这一判断指向了AI算力基础设施正在改变的事实:当GPU芯片的竞争已经白热化,将数以万计的芯片高效串联、协同的网络能力,正在成为决定算力集群性能的又一关键变量。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一个大规模算力集群的构建分为两层。第一层是纵向扩展(Scale-up),在单台服务器或单机柜内集成大量GPU及AI芯片,通过高速互联形成超级计算节点;第二层是横向扩展(Scale-out),通过高速网络将这些节点串联成集群。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在纵向扩展层面,一场围绕超节点卡数的竞赛正在展开。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

2026年1月,英伟达发布第六代NVLink以及NVLink Switch,两者支持最新的Rubin架构,目前商用最大支持72张XPU卡。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国内厂商则推行得相对激进。在中国半导体制造工艺相对落后的背景下,Scale-up被视为通过堆叠更多卡数来规避单一芯片性能不足的替代方案。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据界面新闻此前报道,华为昇腾通过在超节点互联技术上强力投资,发力走“集群规模化”路线,试图凭借这一方向“做到世界上算力最强”,推出了配备384张昇腾AI加速卡的华为昇腾384超节点真机。瞄准类似目标,沐曦推出了连接64张曦云C550通用GPU的超节点产品耀龙S8000 G2。中科曙光在2025年12月也推出了单机柜640卡的scaleX640超节点。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一名从业人士告诉界面新闻,影响超节点内部的串联效率和协同的主要因素是Scale-up协议,互联芯片延迟和带宽;华为昇腾384是现在量产的超节点产品中卡数最多的方案,中科曙光的640卡方案目前尚未量产。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但无论超节点规模最终稳定在何处,它们共同指向了同一瓶颈:节点内芯片越多,节点之间的网络压力就越大。这也带来了高速互联快速膨胀的市场。李斌表示,相比原来的数据中心高速网络的用量,基本上提高了10到20倍,“从网络端口就可以看到市场的增量”。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这恰恰是横向扩展——也是ScaleFabric所瞄准的市场。在横向扩展中,让大量节点高效协同的核心技术是RDMA(远程直接内存访问)。这一技术绕过CPU和操作系统,让机器之间直接读写内存,而这带来的低延迟对AI大模型的训练和推理至关重要。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

实现RDMA有两条主流路线。InfiniBand原生支持RDMA,无需CPU参与即可在系统间进行直接内存传输。英伟达在2019年以69亿美元收购Mellanox后,就牢牢把控了这一高性能网络技术市场,凭借其硅芯片设计专业、自研高速互连和网络技术及CUDA,形成了一套生态内的闭环。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

另一条路线是RoCE(融合以太网上的RDMA),将RDMA功能嫁接到标准以太网上,成本更低、生态更开放,但需要复杂配置才能接近无损效果。Google、Meta等部分海外科技公司及国内互联网大厂均有所采用。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在InfiniBand目前仍是AI高性能网络标杆的背景下,中国公司面临的问题是,这条路线的核心供应被一家美国公司垄断。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在这一背景下,中科曙光选择不走被更多国内厂商采用的RoCE路线,而是自研一套基于InfiniBand技术理念的方案。中科曙光高速网络互联产品部总工程师万伟的解释是,基于在高性能计算的经验,其认为InfiniBand的技术路线在AI和HPC(高性能计算)中有不可替代的优势;作为真正的无损网络,其无损特性对RDMA性能的发挥至关重要。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据界面新闻了解,中科曙光此次发布的ScaleFabric核心是InfiniBand网络的设计思路,可以看作是基于InfiniBand技术的一种优化。作为国内首款原生无损RDMA高速网络方案,ScaleFabric涵盖了从交换芯片、网卡到交换机、驱动与管理软件的完整自研体系。万伟透露,其端到端通信时延的能力上限已做到0.9微秒。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在商业策略上,ScaleFabric试图在英伟达的技术理念与国产自主可控之间找到平衡点。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该系统在定位上对标英伟达Infiniband,系统结构保持透明,通过标准SIP网络接口支持不同计算芯片的互联与适配。在此基础上,团队正在探索让计算芯片通过专有协议直通网卡,同时推动芯片间互联协议的共享,为与其他厂商的计算芯片实现高效直连铺路。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但曙光并不打算将自己锁定在单一协议上。李斌透露,未来的技术路线将探索不同协议的融合,可能在原生RDMA的基础上做不同网络路线的兼容。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

ScaleFabric的意义,或许不在于正面超越英伟达,而在于提供一条国产自主可控的替代路径。李斌对界面新闻表示,中科曙光期待在InfiniBand的技术路线能实现技术上的国产化替代,包括实现业务上真正的市场占比替代。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但技术指标上的接近,与产业生态的成熟之间,仍隔着一段不短的路程。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

北京科技大学高性能计算领域专家储根深对界面新闻表示,国产计算硬件发展总体落后英伟达一到两代,“更难的是上面的生态”。英伟达围绕InfiniBand构建了多年的产业生态,并非单靠硬件性能对标就能复制。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

ScaleFabric目前已在位于郑州的国家超算互联网核心节点三万卡智算集群中进行了部署验证,但更大规模的产业化落地仍需时间。从单一集群内的验证到成为市场上被广泛选择的方案,这条突围之路,可能比单纯的芯片研发周期更为漫长。7GY速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-15693-0.html自研高速网络会成为算力集群的下一战场吗?

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

起草组负责人解读政府工作报告:促消费稳增长,今年更加注重统筹扩大内需和深化供给侧结构性改革|解码政府工作报告
21世纪经济报道记者 李莎 北京报道 2024年3月5日,国新办举行吹风会,对政府工作报告进行解读。政府工作报告将今年经济增长目标定为5%左右,城镇新增就业目标1200万人以上,城镇调查失业率5
本田扩大召回部分进口Acura NSX汽车
  中新经纬3月4日电 据国家市场监督管理总局网站消息,日前,广汽本田汽车有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求,向国家市场监督管理总局备案了召回计划。决定自2024
北汽集团:将在韩国高阳建造电动汽车工厂
近日,从海外媒体获悉,韩国高阳市政府已与中国汽车公司北京汽车签署谅解备忘录,将在高阳自由经济区所在地建设大型电动汽车生产设施。该工厂年产能目标为20万台,计划将90%的电动汽车出口到韩国以外市场。  据悉,北京
一代神车消逝记,福克斯为何一步步走向市场边缘?
有数据显示,2024 年 1 月,福克斯的销量仅为 2 辆,听到这一消息,让笔者感到一阵唏嘘。福克斯,对于许多 80 后、90 后来说,即使没有开过这款车,也一定听过这个名字,它操控性强、性能充沛、运动属性拉满,曾是很多年轻人首
贾跃亭把丁磊告了:大骂李鬼,要伸张正义,昔日搭档反目成仇
贾跃亭的愤怒一击作者|楚门编辑|秦章勇到处寻找“买家”的高合,等来了一个要命的官司。3 月 5 日法拉第未来宣布(FF),以侵犯商业机密和不正当竞争为由,向中国广东省深圳市中级人民法院对 FF 前高管、华人运通创始人
网约车追尾1000万兰博基尼:300万三者险非常有必要买!
3月9日消息,开车上路,保险一定要买,而且要尽可能地买多一些,比如300万的三者险,以防万一。近日,一起“非常贵”交通事故的发生,引起了网民广泛关注和讨论。据网传信息显示,本月8日在浙江杭州,有男孩发视频

热点精选

最新推荐

您可能感兴趣