中国AI“三杰”同日轰炸,召唤百个Agent的门票终于发到每个人手里
(文/陈济深 编辑/张广凯)
1月27日,中国AI届上演了一场史无前例的“饱和式轰炸”:DeepSeek、通义千问、月之暗面——代表中国开源最强战力的“三杰”,不约而同地在同一天发布重磅更新。
不过当天霸占热搜C位、让海外科技圈刷屏的,却是Kimi K2.5。截止到今天上午,外网相关发布量超过1.7万,热度超过了OpenAI发布的科研写作神器Prism。
为什么是Kimi?答案藏在杨植麟那段略显朋克的演示视频里。
杨植麟以一贯的极客风格,在一间略显朋克的会议室里,用一段全程中文的视频演示了新模型的各种全新能力。
这一幕,很容易让人联想到一年前的Manus演示——那个发誓要“终结人类繁琐工作”的通用Agent。
但不同的是,K2.5加入了原生多模态,让模型理解屏幕上的一切;推出了智能体集群,让AI像包工头一样瞬间调度上百个分身并行协作。
更重要的是,这不再是一个画饼的Demo,而是一次面向中文互联网世界的生产力实装。
从这个视角出发,杨植麟过去两年的技术路线图就变得异常清晰且连贯:从K1时代用超长上下文打穿“记忆”,构建数字员工的大脑;到K2时代通过智能体解决“行动”,构建手脚;再到如今K2.5时代用多模态和集群解决“感知与组织”,彻底补齐了五官与协作能力。
一个能看、能想、能干、能协作的“超级个体”终于成型。
开局一张图,内容全靠AI编
在SWE-Bench Verified(编程)和HLE(人类最后考试)等硬核基准测试中,Kimi不仅超越了DeepSeek V3位列开源第一,甚至在多项指标上击败了闭源的GPT 5.2和Gemini 3 Pro实现了全球第一。
但比起跑分真正让从业者背脊发凉的,而Kimi是视觉能力的落地。
如果说去年7月发布的K2让Kimi有了智能体和编程能力,此次K2.5的核心升级之一是原生多模态(Native Multimodal)。
所谓“原生”,意味着视觉理解能力并非外挂模块,而是从架构层面就与语言、代码能力血肉相连。
在实际测试中,这种能力完全颠覆了传统的产品开发流程:用户只需在白板上画一个潦草的网页草图,甚至拍下纸巾上的涂鸦,扔给Kimi并描述“帮我实现它”。几秒钟后,K2.5不仅“看懂”了布局,更自动补全设计细节,生成包含完整HTML、CSS和JS的可运行代码。
更令人惊叹的是它的“动态理解”能力。当录屏一个竞品网站的交互效果并要求“复刻但换肤”时,K2.5能精准解析出按钮悬停特效、卡片翻转动画等动态逻辑。这不再是简单的“识图”,而是对“交互逻辑”的深度复刻。
这意味着“交互成本”的骤降乃至归零。
过去,一个创意从脑海到上线,需要经历“产品经理PRD>UI设计>交互标注>前端开发>QA测试”的漫长链条,整体流程时长需要用周乃至月作为单位。
而K2.5让这个链条瞬间坍缩为一个节点:“决策者直连Kimi”。
更关键的是“审美溢价”。K2.5生成的代码不再是“能跑”的半成品,而是具备合理留白、协调配色和现代审美的“可交付品”。
当“所见即所得”进化为“所见即生成”,Kimi正在成为“初级前端工程师+UI设计师”的功能集合体。
从清华学霸到“一人成军”的包工头
如果说视觉能力解决的是“单点生产力”,那么K2.5祭出的另一张王牌——智能体集群(Agent Swarm)则试图重构企业的组织形式。
以往,Kimi的标签是“读书好的高材生”。但K2.5的发布,让其人设一夜之间转向了又聪明又能够统筹全局的“包工头”。
传统AI无论多强,面对用户时依然是“单体实习生”。即便是试图多开AI界面,不仅操作繁琐,一旦任务复杂或者文本较长,经常也会出现这边忘记了那边说过啥的顾此失彼。
K2.5引入的Agent Swarm架构,让主模型具备了“摇人”的能力——面对复杂任务,Kimi会自动扮演“总指挥”,瞬间创建并调度数十个AI分身。
想象这样一个场景:你需要汇报“100家竞品的定价策略分析”。
在过去,这意味着调动一个3人小组耗时一周。而在K2.5的逻辑里,Kimi会自动召唤一支“AI特遣队”:有的负责搜索采集,有的负责数据清洗,有的负责挑刺审核,有的负责报告撰写。这些Agent并行作业、互相校验,最终将成果汇总交付。
除了性能的提升,Kimi在效率上也有较大突破。
在大规模搜索(wide search)场景下,与单 Agent 执行相比,Agent 集群将达成目标性能所需的最少关键步骤减少了3到4.5倍,且随着目标要求的提升,节省幅度进一步扩大;通过并行化,实际运行时间(wall clock)最高可缩短4.5倍。
这也意味着该技术在Office场景中的落地,展现出极强的商业穿透力。
K2.5可以深度潜伏进Excel、Word等现有工作流。当用户处理万行数据表时,Kimi在后台调度的“隐形军队”能将原本需要数天的工作量压缩至几分钟。
这便是资本最看重的“人效杠杆”。
Agent Swarm指向了一种全新的可能:一个人加上足够的Agent算力,可以拥有一个团队甚至一家微型咨询公司的产出能力。
1 2 下一页 余下全文本文链接:http://m.sushuapos.com/show-3-165679-0.html中国AI“三杰”同日轰炸,召唤百个Agent的门票终于发到每个人手里
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。