中科曙光scaleFabric首发:中国高端RDMA迈入自研时代

观察者网
4次浏览

4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

3月12日,中科曙光宣布实现国产高端原生RDMA技术重大突破,正式发布首款全栈自研400G无损高速网络——scaleFabric。该产品基于原生RDMA架构,从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%自主研发,填补了国内数据中心高速网络领域的空白,以比肩国际顶尖同类产品的性能表现,为超大规模智算集群铺就了一条高带宽、低时延、真无损、超可靠的“算力大动脉”。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

高端智算互联待破局 4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着AI大模型训练与高通量推理计算需求持续扩大,万卡级乃至更大规模的算力集群正成为主流形态。研究表明,在大规模分布式训练中,网络通信耗时占比已达到30-50%,网络性能直接影响算力系统的整体效率。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在大规模智算集群领域,RDMA(远程直接内存访问)网络已成为算力中心的基本需求,凭借零丢包、高带宽、低延迟等特征,可极大提升通信效率。其中,InfiniBand凭借低时延与原生无损传输能力,在全球顶级超算与AI集群中被广泛采用。根据TOP500榜单,目前全球约60%的高性能计算系统采用InfiniBand网络架构。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

长期以来,从高速SerDes IP、核心芯片到IB网卡、IB交换机等设备,InfiniBand相关产业链基本被海外厂商垄断。随着AI算力需求快速增长及数据中心网络持续演进,自主高性能RDMA网络正成为产业关注焦点。中国工程院院士邬贺铨表示,高速网络作为算力基础设施的核心关键技术,其自主可控性直接关系到国家算力基础设施的安全与发展质量。在大模型训练和智算集群规模化部署背景下,网络需要同时具备超低延迟、超高带宽与无损传输能力,而RDMA高速网络正是智算集群的“算力大动脉”。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

中国工程院院士邬贺铨 视频致辞 4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国产原生RDMA问世 4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

scaleFabric是国内首款原生无损RDMA高速网络,面向超大规模智算集群设计,从核心关键IP、交换芯片、网卡到交换机、驱动与管理软件均实现自主研发,构建起从硬件到软件的完整技术体系。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

此次发布的scaleFabric400系列网络产品技术规格全面对标英伟达NDR,部分指标实现赶超。性能方面,scaleFabric400网卡基于PCIe5.0接口,端口带宽达400Gbps,端到端通信时延低至0.9微秒;scaleFabric400交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps,交换时延约260纳秒,支持800G×40或400G×80端口扩展。这一性能组合,可充分满足万卡级AI训练集群对高带宽、低时延网络的极致需求。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

稳定性与扩展能力上,产品采用基于信用的无损流控机制,从根源规避拥塞丢包风险,链路故障恢复时间小于1毫秒,已支撑近万卡集群持续稳定运行验证超10个月。与英伟达NDR相比,交换机端口密度提升25%,网卡最大QP数支持提升100%,单子网互连规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低30%。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在大规模AI训练系统中,网络互联能力已成为影响算力利用率的关键变量。scaleFabric的发布,标志着国产智算网络在高端RDMA领域实现重大突破。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

万卡集群率先验证 4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在实际应用层面,scaleFabric目前已部署于国家超算互联网郑州核心节点,支撑三套万卡级scaleX智算集群上线运行,总规模达3万卡。中科曙光高级副总裁李斌表示,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟,围绕其形成的高性能网络产业生态也正在加速形成。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

运行数据显示,该网络系统在大规模集群环境中保持稳定运行,可支持跨POD组网及大规模并行训练任务,为国产原生无损RDMA网络在高端智算基础设施中的应用提供了实践验证。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

依托在高性能计算、存储与网络领域的长期技术积累,中科曙光已逐步形成“算—存—网”协同发展的完整算力底座能力,为大规模AI基础设施提供系统级支撑。随着政府工作报告提出持续推进“人工智能+”,算力基础设施正进入新一轮升级周期。国产原生RDMA网络的落地,意味着我国在智算互联这一关键环节开始形成自主技术路径,补齐了我国智算基础设施中的关键一环。4yL速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-3-169335-0.html中科曙光scaleFabric首发:中国高端RDMA迈入自研时代

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

四协会倡议酒店等不再主动提供一次性塑料用品
  中新经纬1月12日电 中国饭店协会、中国旅游饭店业协会、中国循环经济协会、中国消费者协会12日联合发文,倡议住宿业减少一次性塑料用品使用。  倡议称:一、深刻认识住宿业在塑料污染治理中的社会责任,高度重视塑料
直播招聘平台用户规模已超2.5亿,人社部发文推广直播带岗
  直播招聘平台用户规模已超2.5亿,人社部发文推广直播带岗  直播带货不新奇,但你知道“直播带岗”吗?  在网络直播间,主播们正在向求职者们介绍着新的岗位,屏幕上求职者们不断提出对工作的问题,等待主播的一一解答...
江苏海安一公司车间发生爆炸,已造成3人死亡2人失联
  中新网2月18日电 海安应急管理微信公众号发布情况通报,2024年2月18日2时11分,海安经济技术开发区亚太轻合金(南通)科技股份有限公司车间内生产铝棒的铸造井区域发生爆炸。截至目前,共造成3人死亡,2人失联,搜救和善后工
中国消费者“点燃”奢侈品市场
  买买买!去年中国奢侈品市场达到6077亿元,约占全球22%   中国消费者“点燃”奢侈品市场  羊城晚报记者 陈泽云  中国人“买买买”奢侈品的热情和实力又回归了!  近日,全球最大奢侈品巨头LVMH发布了2023年全年
保畅保供保民生
新华社济南2月22日电(记者陈国峰、张钟仁)连日来,山东多地迎来大风降温和雨雪天气。21日,受降雪影响,济南西站部分列车降速运行,出现晚点情况。售票大厅内,记者看到“晚点停运车次退票”窗口前排起长龙。国
2月电影票房破100亿,传媒板块多股涨停,行业有望持续繁荣
  2月电影票房破100亿,传媒板块多股涨停,行业有望持续繁荣  2月23日,传媒板块盘中持续走强,截至发稿,宣亚国际20%涨停,赛因集团涨超19%,文投控股、天威视讯、中视传媒等多股涨停,川网传媒、百纳千成涨超8%。  消息上,据

热点精选

最新推荐

您可能感兴趣