“北京造”大模型GLM-4.5开源 综合性能世界领先

千龙网
132次浏览

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。8cx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-13317-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

国家发改委:汽车等以旧换新能创造万亿市场
十四届全国人大二次会议3月6日举行记者会,国家发展和改革委员会主任郑栅洁回答记者提问时表示,推动大规模设备更新和消费品以旧换新,是党中央、国务院着眼于高质量发展大局作出的重大部署,既能促进消费、拉动投资,也能
五大经济部委齐发声:降准有空间,特别国债投向5大领域,股市失灵将果断出手
21世纪经济报道记者杨志锦 北京报道 “今年将5%左右作为中国经济增长预期目标,是党中央、国务院在综合平衡基础上兼顾当前和长远、需要和可能提出的,是经过科学论证的。这一目标符合
碳中和周报(第129期)丨中共中央政治局:以更大力度推动新能源高质量发展;全国碳市场将迎来首次扩围
21世纪经济报道记者李德尚玉 实习生郝文琪 北京报道碳中和周报关注“双碳”领域的最新前沿动态,包括碳中和政策、地方动态、企业实践等。我们将通过精选每周碳中和领域的重大事件,并进
全国人大代表、沈阳市于家台村总书记佟亮:加强农村直播带货基础设施建设
21世纪经济报道记者周慧 北京报道农村居民如何更好的就业和增收?全国人大代表、辽宁省沈阳市辽中区潘家堡镇于家台村党总支书记佟亮,提出了《关于发挥好直播带货的作用 促进农民就业
贾跃亭把丁磊告了:大骂李鬼,要伸张正义,昔日搭档反目成仇
贾跃亭的愤怒一击作者|楚门编辑|秦章勇到处寻找“买家”的高合,等来了一个要命的官司。3 月 5 日法拉第未来宣布(FF),以侵犯商业机密和不正当竞争为由,向中国广东省深圳市中级人民法院对 FF 前高管、华人运通创始人
特斯拉纯视觉坚定跟随者!极越获中国光谷首张L3自动驾驶测试牌照
3月9日消息,在自动驾驶领域,特斯拉当前可以说是非常独特的,因为其坚持采用纯视觉方案,而非不少国内厂商使用的带有激光雷达的“融合感知”,不过有一家品牌则坚定地跟随特斯拉采用纯视觉,它正是极越汽车

热点精选

最新推荐

您可能感兴趣