美国AI内战,谁焦虑了?

7次浏览

2025年只剩最后42天,一个被行业统称为物理世界最强的AI发布了。北京时间昨夜凌晨,Gemini 3 Pro 预览版正式发布,API 同步开放。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

被称为最强,是因为它不仅在所有主要 Arena 排行榜中几乎全部排名第一,且评分断层,就连最大竞争对手OpenAI CEO 奥特曼也罕见地发文称“看起来很不错”,马斯克跟着评论称“做的不错”。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

当天,还是微软的Ignite 2025大会开幕,微软发布了 Edge for Business 浏览器的一系列重大更新,似有隔空对垒之意。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

也有人评价称,这是谷歌对OpenAI最猛烈的一场打击,业内声音认为,Gemini3直击了GPT5的性能高地,甚至是实现了GPT5.1没能实现的效果。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

业内感叹:跑分“断层领先”?XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在 AI 圈子里,大家习惯了模型之间你追我赶的微弱优势,但 Gemini 3 Pro 抛出的这份成绩单,可以说一定程度上拉开了性能差距。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

如果只看跑分,Gemini 3 Pro几乎实现了“断层领先”。除了在软件工程能力上略逊于GPT-5.1和Claude Sonnet 4.5,其他指标,尤其是推理、多模态和Agent工具使用等关键基准上,都实现了全方位的霸榜。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在代表人类智力“天花板”的Humanity's Last Exam中,当GPT-5.1还在26.5%徘徊时,Gemini 3 Pro直接跑出了37.5%的高分。更令人震惊的是,其“深度思考模式”(Deep Think)在不使用任何工具的情况下,得分进一步飙升至41.0%。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在数理方面,Gemini 3 Pro更是展现了统治力。AIME 2025(美国数学邀请赛)配合代码执行,准确率达到惊人的100%。而在代表数学极限的 MathArena Apex 测试里,当其他顶尖模型还在个位数或者 10% 左右挣扎时,Gemini 3 Pro 直接跑出了 23.4% 的分数。这意味着在许多AI曾“看不懂题”的领域,它已经开始攻城略地。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但这些数据,并不是这一夜最让科技圈震动的理由。Gemini 3 Pro 展现出了一种前所未有的体验,它不仅仅是在写代码,它是在搞创作。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在此之前,我们评价一个 AI 的编程能力,看的是它逻辑对不对、Bug 多不多。但 Gemini 3 Pro 突破了这个维度。当用户扔给它一个极其抽象的 Prompt,比如“设计一个很温馨的场景,里面要有哆啦A梦,还有大熊,他们在一起憧憬着未来,并且我需要在浏览器里跑出来。”XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

它不再像以前那样给用户堆砌一堆还需要调试的半成品,短则十几秒后,它可以直接交给用户一个代码 ,并且是一个可以流畅运行的代码。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不仅如此,AI博主数字生命卡兹克还直接让它生成了一个类似window的web os,生造一个系统。结果是,它真的生成出来了,并且还有模有样。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这一刻,很多前端工程师可能感到了一丝寒意。Gemini 3 Pro 证明了,从今天起,前端开发中“手写”的那部分价值正在极速归零。技术门槛被夷为平地,取而代之的是“想象力门槛”。只要人们的 Prompt 描述得足够有画面感、足够有“人味”,这个模型就能把人们的脑洞像素级地还原出来。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不过,它对于程序员来说,目前也不是万能的。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

关于之前网络上传的“彻底颠覆程序员”的说法,实际上,Gemini 3 Pro在AI领域处于顶尖水平,但并未实现“颠覆编程”的目标。在软件工程能力的SWE-Bench Verified测试中,Gemini 3 Pro获得了76.2%的成绩,虽然表现出色,但仍落后于Claude Sonnet 4.5的77.2%(SOTA水平)。这表明,在处理超长、非常复杂的后端逻辑时,它依然存在一定的局限性。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

当前,有不少模型都在着重比拼竞争编程能力,从海外的Claude到国内的Kimi都在主打编程。目前,Gemini更偏向于辅助设计,它不能完全实现重构整个后端架构,但如果用户想设计一个符合现代审美的网站、或生成复杂的SVG交互动画,它都可以通过简单提示,提供令人惊艳、可立即运行的成果。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

另一个例子也证明了,现在的AI还不足以让我们完全信任。今天中午,据科技博主@纯银V发文称,Gemini3 的第一个大型受害者出现了。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

中招的是他一位朋友,在使用 Cursor 进行 AI 编程时,Gemini3 不知抽了什么风,直接删掉了用户 800G 的文件!更绝的是,连 Cursor 自己都没能幸免,一并被“清理”出门。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

目前无法手动恢复,只能找专门的数据恢复公司。 XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

竞争还在升级XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

谷歌这次连开发环境都给重构了。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

伴随模型发布的,还有一个名为 Google Antigravity 的新平台。这可能是目前市面上最接近“自动驾驶编程”的形态。它不再是一个让人们一行行敲代码的编辑器,而是一个“智能体优先”(Agent-first)的指挥中心。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在 Antigravity 里,用户不是一个人在战斗。Gemini 3 Pro 是大脑,负责顶层架构,Gemini 2.5 Computer Use 模型是手眼,负责操控浏览器验证效果,Nano 模型负责打杂。用户下达指令,它们开始分工协作:写代码的写代码,跑测试的跑测试,甚至 AI 会自己打开浏览器看着界面说“这里歪了”,然后自己切回终端进行修正。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这种“端到端”的工程能力,才是谷歌真正的护城河。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这也是为什么谷歌能在这个时间点炸场。当全世界的 AI 公司都在苦苦等待英伟达的 GPU 发货时,谷歌依然坐在自家庞大的 TPU 算力矿山上。这种底层的算力冗余,加上谷歌搜索独有的、涵盖全网数据的知识图谱,让 Gemini 3 Pro 拥有了别人难以复制的“厚度”。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

比如在最新的搜索模式中,当你问一个复杂的物理或生物问题,它不再是给你扔一堆链接,而是直接生成一个可交互的动态模拟器。这种即时生成工具的能力,是算力和数据积累到极致后的溢出表现。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

目前,Gemini 月活跃用户已超 6.5 亿。在今年8月,OpenAI也宣布ChatGPT周活用户达到了8亿。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在争夺普通消费者的赛道上,OpenAI与谷歌的厮杀还在升级。巴克莱银行分析师罗斯·桑德勒曾依据两大巨头的token消耗量估算,在原生消费级AI应用方面,OpenAI的Token消耗量仍是Gemini的两倍以上。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

同在谷歌旗下,DeepMind 的CEO官德米斯・哈萨比斯(Demis Hassabis)在一份声明中表示,由 Gemini 3 驱动的人工智能响应 “将摒弃陈词滥调和刻意讨好,提供真正有价值的见解 —— 告诉你需要知道的事,而非你想听的话”。行业批评人士指出,当前的人工智能聊天机器人往往过于 “谄媚”。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而就在一周前,OpenAI更新GPT5.1时称,GPT-5.1的答案让人感觉更聪明,语气更自然。优秀的人工智能不仅应该是聪明的,而且应该提供令人愉快的交谈。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不过,在商业模式上,二者存在显著差异,可能使其面临的压力不同。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

多家媒体近期报道称,一份据称来自OpenAI内部的文件称,OpenAI的实际运营成本可能远超外界想象,而其收入则被显著夸大,这使得其高昂的运营成本与收入之间存在一条惊人的鸿沟。数据显示,从2024年第一季度到2025年第三季度的七个季度里,OpenAI仅在Azure上的推理计算支出就超过了124亿美元。仅在2025年的前九个月,其推理成本就已高达86.7亿美元。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

10 月 29 日,谷歌母公司 Alphabet 发布截至 2025 年 9 月 30 日的第三季度财报。数据显示,Alphabet 第三季度总营收达 1023.46 亿美元,较去年同期的 882.68 亿美元增长 16%,五年前,这一数字是500亿美元。Alphabet CEO桑达尔・皮查伊称,人工智能正为其创造切实价值。值得一提的是,在巴菲特发出最后一封股东信之际,伯克希尔·哈撒韦公司发布持仓报告显示,截至今年第三季度末,该公司已建仓价值43亿美元的谷歌股票,并继续减持苹果。这将是巴菲特在退休前的最后一场关键战役,在人工智能领域,股神已做出选择。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这意味着,摆在OpenAI面前的仍旧是一道艰难的生死题,如果不能显著超越Gemini,ChatGPT拉开的用户规模差距仍旧可能被追上,那对于烧钱换规模的OpenAI而言,将是毁灭性的打击。XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM


XUi速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-3-159502-0.html美国AI内战,谁焦虑了?

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

2024春节档:史上最火,史上最“卷”
  2024春节档:史上最火,史上最“卷”  羊城晚报记者 李丽  据国家电影局统计数据,2024年春节档总票房80.16亿元,在观影人次、场次和票房3个维度创造影史最高纪录。  过去10年间,看电影逐渐成为中国人过年的新民俗
大湾区五年“马力”十足
从广州市区驱车一个多小时,到达依山傍水的从化区。香港赛马会从化马场就坐落在从化流溪河畔的半山腰上,四周树木葱郁,山峰连绵。五年前的2月18日,《粤港澳大湾区发展规划纲要》正式发布,提出加强
迟福林:“尔滨现象”对东北振兴的启示
哈尔滨冰雪大世界日前正式闭园。暂别冬日火爆“出圈”的“尔滨”,东北正迎来全面振兴的春天。从全面振兴的视角研究和探讨“尔滨现象”,具有特殊意义。这是因为,全面振兴的关键在于产业转型发展
探寻“何以中国”,照鉴“未来何处”
中国考古,在许多外国人甚至中国人看来,一度非常神秘。近日记者在与中国考古学家的交流中了解到,从考古技术发展、到公众考古创新,再到中外考古交流,中国正不断构建具有中国特色、中国风格、中国气派的考古
招聘求职人行早 “用工忙”折射经济开局稳
龙年开工首周,记者在多地采访看到,企业加快开工复产、劳动者积极返岗求职,呈现出人勤春来早、供需同发力的繁忙景象。“用工忙”折射开局稳,释放出经济运行回稳向好的信心。从跨省招工、专车专列接人返岗
亚布力对话|居然之家汪林朋:出海首站瞄准东南亚
  中新经纬2月22日电(王玉玲 刘雪玉)22日,居然之家创始人兼董事长汪林朋在亚布力中国企业家论坛间隙接受中新经纬专访时表示,2024年,居然之家将把主要精力聚焦在出海业务上,将通过电商平台和实体门店的方式走向东南亚。

热点精选

最新推荐

您可能感兴趣