“北京造”大模型GLM-4.5开源 综合性能世界领先

千龙网
112次浏览

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。4uA速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-13317-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

绿美广东|广东十二部门联合发文,全面加强野生植物保护工作
南方财经全媒体见习记者林鹏 实习生 张梦琦 辛瑞 广州报道日前,南方财经全媒体记者从广东省林业局获悉,《关于进一步加强野生植物保护管理工作的通知》(以下简称《通知》)正式发布,明确
全国政协委员张云泉:“东数西算”枢纽节点需定期全面评估并据结果动态调整
21世纪经济报道 记者郑雪 北京报道算力是新型关键生产力,是国民经济发展的重要基础设施。相关数据显示,截至2023年8月,我国算力总规模达到1.97万亿亿次浮点运算(197EFLOPS),位居全球第二。
Stellantis宣布:5年向南美投资56亿欧元
3月7日,Stellantis集团宣布从2025年到2030年期间,集团将向南美洲投资56亿欧元。据悉,这将是南美洲汽车产业史上所获得的金额最大的投资。  值得一提的是,Stellantis集团将“南美洲、中东及非洲、中国、印度和亚太”
南财记者直击第二次部长通道 五位部长回应社会关切
21世纪经济报道记者 缴翼飞 北京报道3月8日,十四届全国人大二次会议第二场“部
深蓝汽车全新车型 G318 将于 3 月 18 日亮相,定位增程式硬派 SUV
3 月 10 日消息,长安汽车旗下深蓝汽车日前宣布,“深蓝超级增程进化日暨 G318 亮相发布会”即将于 3 月 18 日在成都举行,被官方称为“科技新硬派”的全新车型 ——SUV G318 将同期亮相。据悉,该车采用 1.5T 发动
快要露真容了 曝阿尔卑斯首款SUV假想图
3月8日,有国内媒体曝光了一张蔚来第二品牌“阿尔卑斯”首款SUV的假想图,并附文:“今天给阿尔卑斯1的研发高层看了这张图,回复是「真像」,好了,外观就是这个样子,大差不差了,就等前脸了,我觉得侧后还是不错的。”根据此前官

热点精选

最新推荐

您可能感兴趣