姚期智院士:AI欺骗引发“生存性”风险

澎湃新闻
147次浏览

 KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者摄

  ?KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在他看来,这类生存性风险有两个不同方向。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

(原标题:姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓)KF8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://www.gihot.com/show-11-22407-0.html姚期智院士:AI欺骗引发“生存性”风险

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

南财观察|两会热议预制菜:广东如何打造产业新优势?
南方财经全媒体记者高慧超 实习生卢秀颖 卢诗文 北京报道预制菜再度成为两会代表委员热议的焦点。尽管各种关于预制菜的争议仍在继续,但并不妨碍预制菜在龙年春节登上年夜饭饭桌,线
绿美广东|广东十二部门联合发文,全面加强野生植物保护工作
南方财经全媒体见习记者林鹏 实习生 张梦琦 辛瑞 广州报道日前,南方财经全媒体记者从广东省林业局获悉,《关于进一步加强野生植物保护管理工作的通知》(以下简称《通知》)正式发布,明确
岚图CEO回应:央企新能源汽车单独考核
近日,全国两会上,国务院国资委主任张玉卓表示,新能源汽车,国有汽车企业在这方面发展还不够快,我们调整政策,对三家中央汽车企业,进行新能源汽车业务的单独考核。对此,东风集团旗下岚图汽车CEO卢放表示,“单独考核”政策对
专访全国政协委员、陕西高院副院长巩富文:建议出台《人工智能促进法》推动AI产业发展
21世纪经济报道 记者郑雪 北京报道人工智能发展如火如荼。2月初,Sora的发布只是新一轮竞争的开始,随后发布的Mistral Large大模型、Claude 3模型再次吸引全球目光。我国人工智能产业如
东风汽车涨停!三家中央汽车企业新能源汽车业务将会单独考核
  东风汽车涨停!三家中央汽车企业新能源汽车业务将会单独考核  在利好消息的影响下,A股汽车板块3月5日午前和尾盘出现反复活跃。  3月5日上午,第十四届全国人民代表大会第二次会议在人民大会堂举行开幕会。开幕会
特斯拉 Cybertruck 纯电皮卡防弹测试
3 月 9 日消息,数码评测频道 JerryRigEverything 在最新一期视频中,使用不同口径、不同的武器,专门评测了特斯拉 Cybertruck 纯电皮卡的防弹性能。此前报道,马斯克给出了更具体的解释:“车门板对几乎所有亚音速子

热点精选

最新推荐

您可能感兴趣