DeepSeek双模型发布:话少助手+偏科天才

科技日报
24次浏览

 m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

12月1日,DeepSeek(深度求索公司)同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。在公开推理测试中,V3.2水平达到了开放人工智能公司(OpenAI)今年8月推出的大模型GPT-5水平,略低于谷歌(Google)的Gemini3 Pro,国产大模型再一次吸引全球目光。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

图片来源:视觉中国


m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

两款模型各有所长m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“简单来说,区别于聊天机器人式大模型,DeepSeek-V3.2更像一位‘话少活好’的助手。”DCCI互联网研究院院长、中国社会科学院大学数字中国研究院特聘研究员刘兴亮解释道,这位助手主打高性价比与日常使用,具备更强的推理能力和智能体(Agent)能力,未来有望成为“数字劳动力”,完成自动生成报表、编写代码等复杂工作。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而V3.2-Speciale更像一位“偏科”的科研天才,专攻高难度数学问题求解、学术研究逻辑验证、编程竞赛解题等,旨在将开源模型推理能力推向极致。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

工业和信息化部信息通信经济专家委员会委员盘和林表示,新模型有两个质的突破:引用DSA(领域专用架构)和思考型工具调用技术。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

盘和林用了一个形象的比喻解释DSA技术:“如果把大模型比作图书管理员,以往旧模型在找书时,每次都要从头一本一本找,词元消耗多且效率低。而DSA让它只需检索最关键信息,可以大幅缩小书架寻找范围,进而提升效率、降低消耗。”m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

思考型工具调用技术,则瞄准大模型“一思考手就停”的短板。“此前大模型多限于单轮问答,无法像人类一样,在解决复杂问题时进行多轮思考和查阅资料。”盘和林说,“这项新技术让模型得到指令后,能先思考再调用代码执行、数据库查询等工具接口,然后根据结果继续思考、再次调用,如此交替反复,并保留记录供后续推理使用。”m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“这是DeepSeek首次将思考融入工具使用,改变了以往模型依赖人‘喂’数据的发展范式,实现AI的自我训练和进化。”盘和林说。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

开源模型大有可为m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

过去一年,大语言模型快速发展,以Google、OpenAI等为代表的闭源社区在复杂任务中表现得愈发优越,而开源社区受制于架构、资源分配及智能体能力等方面的关键缺陷,与闭源社区性能差距进一步扩大。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

DeepSeek团队称,这是他们发布新模型的根本动力来源。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

刘兴亮认为,新模型缩小了当前开源模型与闭源模型间的差距,证明了闭源大模型的巅峰并非不可逾越,为我国乃至全球开源大模型的发展注入强心剂。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

盘和林表示,从今年初发布R1大模型,以深度思考模式和超低成本预算实现中国人工智能发展弯道超车后,DeepSeek的发展主线始终聚焦实用性和泛化能力,让“赶超闭源”从美好愿景变为闭源厂商的现实压力。“最重要的是,DeepSeek为全球开发者提供了一个强大、可控且经济的模型底座,助力大语言模型融入千行百业、形成商业闭环。”他说。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

同时,盘和林也提醒,新模型为大语言模型带来了新的治理难题。“需警惕工具调用风险,以及学术造假、自动化生成代码漏洞、产业不公平竞争等挑战,推动开源模型向‘少说话多办事更安全’跃升。”m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据悉,DeepSeek的官方网页端、App和API(应用程序编程接口)均已更新为正式版DeepSeek-V3.2,但Speciale版本目前仅以临时API服务形式开放,供社区评测与研究。m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

(原标题:DeepSeek双模型发布:一位是“话少助手” 一位是“偏科天才”)m16速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://www.gihot.com/show-11-29068-0.htmlDeepSeek双模型发布:话少助手+偏科天才

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

3月11日首发 保时捷Taycan高性能版预告
近日,保时捷官方发布了新款Taycan高性能版的预告,该车正是此前缔造纽北圈速7分07秒55原型车的量产版,该圈速比Taycan Turbo S快了26秒,比特斯拉Model S Plaid快了17.6秒。据此前消息,该车有望搭载三电机系统,最大功率超
美国造车新势力大败退
  美国造车新势力大败退  几年前,美国造车新势力Rivian、Lucid和Fisker都曾风光无限,在投资者兴趣高涨的情况下,这些电动汽车制造商的市值一度有向特斯拉挑战的架势。而今天的情况却没那么乐观,2024年开年,造车新势力
吉利银河 E8 性能版车型开启交付:22.88 万元,3.49 秒破百、续航 620km
3 月 8 日消息,今晚,吉利银河 E8 的 620km 星舰性能版车型正式开启交付,其售价为 22.88 万元。吉利银河 E8 已经于今年 1 月上市,提供 5 种不同配置,售价区间为 17.58 万-22.88 万元。该车前脸采用了涟漪美学设计
奇瑞尹同跃两会建议:出台越野体验管理办法
今年的十四届全国人大二次会议期间,全国人大代表,奇瑞控股集团党委书记、董事长尹同跃提出了7项建议,围绕加强中国汽车出口管理体系建设、提高新能源汽车安全及智能化标准、建立碳足迹管理法规、推进E-fuel绿色合成
南财对话|专访商务部研究院张建平:新质生产力驱动外贸转型升级,广东要为制度型开放先行先试
南方财经全媒体记者冯玉怡 施诗 北京报道今年政府工作报告提出,推动外贸质升量稳,积极扩大优质产品进口,全面实施跨境服务贸易负面清单,出台服务贸易、数字贸易创新发展政策,办好进博会
【财眼观两会】专访汽车流通协会郎学红:汽车以旧换新或撬动1000万辆市场增量
  中新经纬3月7日电 (宋亚芬)汽车消费等大宗消费一直是中国政府促进消费的工作重点,今年也不例外。2024年的政府工作报告提出要“稳定和扩大传统消费,鼓励和推动消费品以旧换新,提振智能网联新能源汽车、电子产品等大

热点精选

最新推荐

您可能感兴趣