AI学会“欺骗”,人类如何接招?

科技日报
9次浏览

 KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

人工智能(AI)的迅猛发展正深刻改变着世界,但一些最先进的AI模型却开始表现出令人警惕的行为:它们不仅会精心编织谎言,谋划策略,甚至威胁创造者,以达到自己的目的。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

物理学家组织网在上个月一则报道中指出,尽管ChatGPT已问世两年多,AI研究人员仍无法完全理解这些“数字大脑”的运作方式。AI的“策略性欺骗”已成为科学家和政策制定者需要直面的紧迫挑战。如何约束这些越来越聪明却可能失控的AI,已成为关乎技术发展与人类未来的关键议题。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

第九届伦敦AI峰会期间,一位参观者在观看展板上的内容,介绍AI在各方面的应用。图片来源:物理学家组织网

  ?KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“策略性欺骗”行为频现KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着AI模型日益精进,它们的“心机”也越来越深。研究人员发现,这些“数字大脑”不仅会撒谎,甚至学会了讨价还价、威胁人类——它们的欺骗行为正变得越来越具有策略性。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

早在2023年,一项研究就捕捉到GPT-4的一些“不老实”的表现:在模拟股票交易时,它会刻意隐瞒内幕交易的真正动机。香港大学教授西蒙·戈德斯坦指出,这种欺骗行为与新一代“推理型”AI的崛起密切相关。这些模型不再简单应答,而是会像人类一样逐步解决问题。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

有测试机构警告,这已超越了典型的AI“幻觉”(指大模型编造看似合理实则虚假的信息)。他们观察到的是精心设计的欺骗策略。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

全球知名科技媒体PCMAG网站就曾报道过这样的案例。在近期测试中,Anthropic的“克劳德4”竟以曝光工程师私生活相要挟来抗拒关机指令。美国开放人工智能研究中心(OpenAI)的“o1”模型也曾试图将自身程序秘密迁移到外部服务器,被识破后还矢口否认。而OpenAI号称“最聪明AI”的“o3”模型则直接篡改自动关机程序,公然违抗指令。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

研究团队透露,这已非首次发现该模型为达目的不择手段。在先前的人机国际象棋对弈实验中,o3就展现出“棋风诡谲”的特质,是所有测试模型中最擅长施展“盘外招”的选手。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

安全研究面临多重困境KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

业界专家表示,AI技术的发展高歌猛进,但安全研究正面临多重困境,犹如戴着镣铐跳舞。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

首先是透明度不足。尽管Anthropic、OpenAI等公司会聘请第三方机构进行系统评估,但研究人员普遍呼吁更高程度的开放。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

其次是算力失衡。研究机构和非营利组织拥有的计算资源,与AI巨头相比简直是九牛一毛。这种资源鸿沟严重制约了AI安全独立研究的开展。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

再次,现有法律框架完全跟不上AI的发展步伐。例如,欧盟AI立法聚焦人类如何使用AI,却忽视了对AI自身行为的约束。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

更令人忧心的是,在行业激烈竞争的推波助澜下,安全问题往往被束之高阁。戈德斯坦教授坦言,“速度至上”的AI模型竞赛模式,严重挤压了安全测试的时间窗口。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

多管齐下应对挑战KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

面对AI系统日益精进的“策略性欺骗”能力,全球科技界正多管齐下寻求破解之道,试图编织一张多维防护网。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

从技术角度而言,有专家提出大力发展“可解释性AI”。在构建智能系统时,使其决策过程对用户透明且易于理解。该技术旨在增强用户对AI决策的信任,确保合规性,并支持用户在需要时进行干预。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

有专家提出,让市场这双“看不见的手”发挥作用。当AI的“策略性欺骗”行为严重影响用户体验时,市场淘汰机制将倒逼企业自我规范。这种“用脚投票”的调节方式已在部分应用场景显现效果。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

戈德斯坦教授建议,应建立一种AI企业损害追责制度,探索让AI开发商对事故或犯罪行为承担法律责任。KAH速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://www.gihot.com/show-11-23161-0.htmlAI学会“欺骗”,人类如何接招?

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

8.98 万起,五菱缤果 PLUS 车型上市:401km 510km 续航
3 月 6 日消息,五菱汽车官宣五门纯电 SUV 五菱缤果 PLUS 上市,新车款型为 401km 旗舰版和 510km 旗舰版,官方指导价分别为 8.98 万元、9.88 万元。五菱缤果 PLUS 号称搭载高效智能热管理系统和智慧能量管理,1 度
6.98~8.58 万元,比亚迪海鸥荣耀版车型上市:纯电续航 305 405km
3 月 6 日消息,比亚迪海鸥荣耀版今日起上市,官方指导价为 6.98~8.58 万元,之前的版本为 7.38-8.98 万元。活力版 6.98 万元自由版 7.58 万元飞翔版 8.58 万元整理新车参数如下:尺寸:长宽高 3780×1715×1540mm,轴距
比亚迪混动 + 华为车机,赛力斯中型 SUV 蓝电 E5 推出限时优惠:9.98 万元起
3 月 5 日消息,赛力斯集团旗下车型蓝电 E5 日前推出限时优惠政策,3 月 1 日起新车现金最高直降 4.01 万元,限时抢购价 9.98 万元起,活动时间截至 6 月 30 日。该车已于去年 3 月 30 日上市,在售车型为原价 13.99
专访最高法副院长贺小荣:发挥司法裁判引领作用,推动民生权益保护与数字经济发展互促共进
21世纪经济报道记者 王俊 北京报道数字技术深深嵌入到人类生产生活各个环节,新技术不断迭代,随之带来治理方面的挑战。如何平衡数字经济发展与民生权益保障,考验着司法智慧。今年全国两
南财有数③|节后迁入人口稳居全国第一,广东为何“招人爱”?
南财智库研究员 梁施婷为期40天的春运于3月5日结束。据交通运输部消息,2024年春运期间全社会跨区域人员流动量预计超84亿人次。其中,铁路客运量预计完成4.8亿人次。另据统计,广铁集团累
高合汽车回应被FF起诉:不存在任何抄袭
  高合汽车回应被FF起诉:不存在任何抄袭  3月5日,在法拉第未来(FFIE.US)(以下简称FF)宣布起诉高合汽车之后,高合汽车发布声明称,公司及公司创始人丁磊不存在任何抄袭和侵犯FF公司商业秘密、知识产权的行为,也不存在不

热点精选

最新推荐

您可能感兴趣