“北京造”大模型GLM-4.5开源综合性能世界领先-速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“北京造”大模型GLM-4.5开源综合性能世界领先

千龙网

发布时间：2025-08-01 10:56:35 132次浏览

7月28日晚，北京智谱华章科技股份有限公司（以下简称"智谱AI"）发布其新一代旗舰大模型GLM-4.5，这是一款专为智能体应用打造的基础模型，在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破，综合测试性能已跻身全球领先行列。

这款新模型的发布，代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”，而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如，模型能够胜任全栈开发任务，一键生成较为复杂的应用、游戏、交互网页。在实际例子中，用户通过z.ai使用该模型时，仅用一句简单的指令，就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”，甚至直接上线一个完整的“Flappy Bird”小游戏。

在性能评估中，GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中，其综合得分位列全球第三，在所有国产模型和开源模型中均排名第一。

大型语言模型性能评估表，包含智能体、推理与编码基准测试数据（图源：智谱）

该款旗舰大模型发布仅十小时，便引发全球外媒关注。价格因素同样是关注焦点，报道普遍聚焦该模型 “成本更低、性能更优” 的特性，部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens，远低于市场主流价格。

28日模型发布后不到两个小时，X平台就在首页推荐了这款中国大模型。CNBC在28日报道称：“中国企业正在研发的人工智能模型不仅智能化水平提升，使用成本也持续降低，这与深度求索（DeepSeek）当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到，作为中国 “AI 六小虎” 之一的智谱，自今年6月被OpenAI“点名”后便备受关注。彭博社表示，OpenAI的挑战者智谱AI发布开源模型，试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出：“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说，这是一个令人信服的选择。”发布后不到12小时，GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道，受到国内外业界高度关注。

美国科技网站Techi 认为，中国AI发展正清晰呈现 “易获取” 的趋势：“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格，中国正逐步成为全球AI竞争的核心参与者，力争占据领先地位。未来几个月，这些快速变化将带来何种影响——是催生新的监管政策，还是推动新的技术创新，仍有待观察。”

受到大模型关注的除了这款大模型的性能，还有一个最大亮点是这是首款原生融合模型，首次在单个模型中实现将推理、编码和智能体能力原生融合，以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而，现有模型仍然算不上真正的通用模型：有些擅长编程，有些精于数学，有些在推理方面表现出色，但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力，力求在一个模型中集成所有这些不同的能力。大模型的下一个范式，一定是把各种能力整合到一起，成为一个“全优生”。

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一，但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上，GLM-4.5系列位于性能/参数比帕累托前沿，这表明在相同规模下，GLM-4.5系列实现了最佳性能。

目前，这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型，其开源版本也将同步登陆Hugging Face与ModelScope平台。

7月28日晚，北京智谱华章科技股份有限公司（以下简称"智谱AI"）发布其新一代旗舰大模型GLM-4.5，这是一款专为智能体应用打造的基础模型，在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破，综合测试性能已跻身全球领先行列。

这款新模型的发布，代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”，而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如，模型能够胜任全栈开发任务，一键生成较为复杂的应用、游戏、交互网页。在实际例子中，用户通过z.ai使用该模型时，仅用一句简单的指令，就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”，甚至直接上线一个完整的“Flappy Bird”小游戏。

在性能评估中，GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中，其综合得分位列全球第三，在所有国产模型和开源模型中均排名第一。

大型语言模型性能评估表，包含智能体、推理与编码基准测试数据（图源：智谱）

该款旗舰大模型发布仅十小时，便引发全球外媒关注。价格因素同样是关注焦点，报道普遍聚焦该模型 “成本更低、性能更优” 的特性，部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens，远低于市场主流价格。

28日模型发布后不到两个小时，X平台就在首页推荐了这款中国大模型。CNBC在28日报道称：“中国企业正在研发的人工智能模型不仅智能化水平提升，使用成本也持续降低，这与深度求索（DeepSeek）当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到，作为中国 “AI 六小虎” 之一的智谱，自今年6月被OpenAI“点名”后便备受关注。彭博社表示，OpenAI的挑战者智谱AI发布开源模型，试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出：“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说，这是一个令人信服的选择。”发布后不到12小时，GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道，受到国内外业界高度关注。

美国科技网站Techi 认为，中国AI发展正清晰呈现 “易获取” 的趋势：“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格，中国正逐步成为全球AI竞争的核心参与者，力争占据领先地位。未来几个月，这些快速变化将带来何种影响——是催生新的监管政策，还是推动新的技术创新，仍有待观察。”

受到大模型关注的除了这款大模型的性能，还有一个最大亮点是这是首款原生融合模型，首次在单个模型中实现将推理、编码和智能体能力原生融合，以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而，现有模型仍然算不上真正的通用模型：有些擅长编程，有些精于数学，有些在推理方面表现出色，但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力，力求在一个模型中集成所有这些不同的能力。大模型的下一个范式，一定是把各种能力整合到一起，成为一个“全优生”。

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一，但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上，GLM-4.5系列位于性能/参数比帕累托前沿，这表明在相同规模下，GLM-4.5系列实现了最佳性能。

目前，这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型，其开源版本也将同步登陆Hugging Face与ModelScope平台。

点击展开全文

本文链接：http://m.sushuapos.com/show-2-13317-0.html“北京造”大模型GLM-4.5开源综合性能世界领先

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：调查｜外骨骼机器人火了！能干啥？哪儿能买？贵不贵？

下一篇：清华突破软体机器人操控难题磁性机器人像“液滴”般移动