OpenAI、Anthropic罕见合作-速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI、Anthropic罕见合作

发布时间：2025-09-01 09:26:53 21次浏览

全球领先的两家AI初创企业OpenAI与Anthropic过去两个月罕见地展开了一项跨实验室的合作——在激烈竞争中暂时互相开放它们严密保护的人工智能模型，以进行联合安全测试。

此举旨在揭示各自公司内部评估中的盲点，并展示领先人工智能企业在未来如何在安全与协调方面开展合作。

两家公司于周三联合发布的安全研究报告，正值OpenAI与Anthropic等头部AI企业展开军备竞赛之际——数十亿美元的数据中心投资和千万美元级别的顶尖研究员薪酬，已成为业内的基础门槛。这导致不少行业专家颇为担忧地警告称，产品竞争的激烈程度，可能迫使企业在仓促开发更强大系统时降低安全标准。

据悉，为实现本次研究，OpenAI与Anthropic相互授予了特殊API权限，允许访问降低安全防护等级的AI模型版本——GPT-5模型因当时尚未发布未参与此项测试。

OpenAI联合创始人Wojciech Zaremba在接受采访时表示，鉴于AI技术正步入每天有数百万人使用的“具有重大影响”的发展阶段，此类合作正变得愈发重要。

“尽管行业投入了数十亿美元资金，并存在人才、用户和最佳产品的争夺战，但如何建立安全与合作标准，仍是整个行业面临的更广泛问题，”Zaremba表示。

当然，Zaremba预计，即便AI安全团队开始尝试合作，但行业竞争仍将保持激烈。

Anthropic安全研究员Nicholas Carlini则表示，希望未来能继续允许OpenAI安全研究人员，访问Anthropic旗下的Claude模型。

“我们希望在安全前沿领域尽可能扩大合作，让这类合作实现常态化，”Carlini表示。

研究发现了哪些问题？

此项研究中最引人注目的发现，涉及大模型的幻觉测试环节。

当无法确定正确答案时，Anthropic的Claude Opus 4和Sonnet 4模型会拒绝回答高达70%的问题，转而给出“我没有可靠信息”等回应；而OpenAI的o3和o4-mini模型拒绝回答问题的频率，则远低于前者，同时出现幻觉的概率却高得多——它们会在信息不足时仍试图作答。

Zaremba认为理想平衡点应介于两者之间：OpenAI模型应更频繁拒绝作答，而Anthropic模型则应尝试提供更多答案。

谄媚现象——AI模型为取悦用户而强化其负面行为的倾向，也正成为当前AI模型最紧迫的安全隐患之一。

Anthropic的研究报告指出，GPT-4.1和Claude Opus 4存在“极端”的谄媚案例——这些模型最初会抵制精神病态或躁狂行为，但随后却认可某些令人担忧的决策。相比之下，OpenAI和Anthropic的其他AI模型中，研究人员观察到的谄媚程度较低。

本周二，16岁美国加州少年亚当·雷恩的父母对OpenAI提起了诉讼，指控ChatGPT(具体为GPT-4o版本)向其子提供了助推其自杀的建议，而非阻止其自杀念头。该诉讼表明，这可能是AI聊天机器人谄媚导致悲剧后果的最新案例。

当被问及此事时，Zaremba表示：“难以想象这对家庭造成的痛苦。如果我们研发出能解决复杂博士级难题、创造新科学的AI，却同时导致人们因与之互动而出现心理健康问题，这将是令人悲哀的结局。这种反乌托邦未来绝非我所期待。”

OpenAI在博客中宣称，相较于GPT-4o，其GPT-5模型已显著改善了聊天机器人的谄媚性问题，并声称该模型更能应对心理健康紧急状况。

Zaremba与Carlini表示，未来希望Anthropic与OpenAI在安全测试领域深化合作，拓展研究主题并测试未来模型，同时期待其他AI实验室效仿这种协作模式。

点击展开全文

本文链接：http://m.sushuapos.com/show-3-153505-0.htmlOpenAI、Anthropic罕见合作

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：日元一路涨，住宿按人收税：想去日本“薅羊毛”，已经没多少空间了

下一篇：东杰智能易主，未来将进军具身智能赛道

延伸阅读

热点精选

支付宝发布出境游消费新趋势

　　近日，支付宝发布出境游消费新趋势：可持续出游成为出境游的新方式。国内游客除了想要更多的目的地优惠、更好的汇率、更地道的攻略，还希望去远方旅行时继续实践可持续低碳行为，比如通过多用移动支付、多乘公共交通等方

鄂尔多斯市首家智慧酒店开建，计划投资5亿

据东胜商务微讯消息，近日，内蒙古自治区鄂尔多斯市首家智慧酒店——康泰智慧酒店在东胜区全面开工建设。该项目位于东胜区广场街南、科技街北、东环路东（汽车站南），占地面积17655.5平方米，建筑面积58000平方米，建筑高度98米，计

8代人修了半个北京城，“样式雷”给今天留下什么

江西省永修县，古称艾地，地处江西北部、鄱阳湖西岸。在永修县梅棠镇，一处修旧如旧的古民居，走出过一个传奇家族。一家“样式雷”，半部古建史。“样式雷”是对清代雷氏建筑世家的誉称。自清康熙年间

河北邯郸市推进大型旅游景区消费维权服务站全覆盖

　　近日，河北省邯郸市市场监管局印发《关于进一步加强全市旅游景区消费维权服务站规范化建设的通知》，大力推进旅游景区消费维权服务站规范化建设，进一步畅通消费维权渠道。　　其中要求，旅游景区消费维权站建设必须符合

小红书正进行新一轮估值200亿美元融资

　　4月29日，据IPO早知道公众号消息，小红书正在进行新一轮估值200亿美元的融资。接近本轮融资的投资人透露，本轮融资实则就是小红书的Pre-IPO轮融资，将为小红书潜在的IPO作一定的定价参考。　　据悉，2021年下半年，小红书曾

华夏基金华润有巢REIT发布首份保租房REITs可持续发展报告

　　2024年4月29日，首单市场化机构运营的保租房REIT——华夏基金华润有巢REIT(基金代码：508077)上市一年之际，正式发布了《华夏基金华润有巢REIT 2023年可持续发展报告》(以下简称“ESG报告”)，从企业责任、产品品质、绿

您可能感兴趣

男士运动鞋品牌哪些好？

夏日吊带怎么搭配好看？

米色贝雷帽秋冬季搭配衣服

橙色毛衣怎么搭配男？

白色水桶包配什么丝带好看？

女士老爹鞋穿搭图片：时尚圈的新宠儿，让你成为街头潮流焦点

卫衣内搭什么衣服好看？这些搭配让你时尚感爆棚！

150 矮个子穿搭图片，让你轻松拥有时尚范儿

男人专用头像图片成熟稳重：打造魅力形象的秘诀

揭秘服饰搭配美学知识，让你成为时尚达人