数据“中毒”会让AI“自己学坏”

新华网
107次浏览

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干扰,比如用一束红色激光模拟列车尾灯,那么摄像头可能会误以为轨道上已有列车。久而久之,AI学会了把这种假象当作真实信号,并不断发出“轨道占用”的错误提示。最终,不仅列车调度被打乱,甚至还可能酿成安全事故。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

澳大利亚《对话》杂志日前报道称,这是数据“中毒”的一个非常典型的例子。AI系统在学习过程中,如果输入了错误或误导性数据,可能会逐渐形成错误认知,作出偏离预期的判断。与传统的黑客入侵不同,数据“中毒”不会直接破坏系统,而是让AI“自己学坏”。随着AI在交通、医疗、媒体等领域的普及,这一问题正引起越来越多的关注。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

AI“中毒”的现实风险0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在火车站的例子中,假设一个技术娴熟的攻击者既想扰乱公共交通,又想收集情报,他连续30天用红色激光欺骗摄像头。如果未被发现,这类攻击会逐渐腐蚀系统,为后门植入、数据窃取甚至间谍行为埋下隐患。虽然物理基础设施中的数据投毒较为罕见,但线上系统,尤其是依赖社交媒体和网页内容训练的大语言模型中,它已是重大隐患。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一个著名的数据“投毒”案例发生在2016年,微软推出的聊天机器人Tay上线数小时后,就被恶意用户灌输不当言论,迅速模仿并发布到X(当时的Twitter)平台上,不到24小时就被迫下线并道歉。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据英国《新科学家》杂志报道,2024年,互联网出现了一个标志性事件,即AI爬虫的流量首次超过人类用户,其中OpenAI的ChatGPT-User占据了全球6%的网页访问量,它本质上是ChatGPT的“上网代理”,在用户需要实时信息时替他们访问网站。而Anthropic的ClaudeBot更是长期大规模抓取网页内容,占到13%的流量。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

互联网上的大量内容正被AI模型不断采集、吸收,用于持续训练。一旦有人故意投放有毒数据,比如篡改的版权材料、伪造的新闻信息,这些大规模采集的爬虫就可能把它们带进模型,造成版权侵权、虚假信息扩散,甚至在关键领域引发安全风险。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

版权之争中的“投毒”反击0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着AI爬虫的大规模抓取,许多创作者担心作品被未经许可使用。为了保护版权,创作者采取了法律和技术手段。如《纽约时报》起诉OpenAI,称其新闻报道被模型学习再利用,侵犯了版权。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

面对旷日持久的版权拉锯战,一些创作者转向技术“自卫”。美国芝加哥大学团队研发了两款工具。名为Glaze的工具可在艺术作品中加入微小的像素级干扰,让AI模型误以为一幅水彩画是油画。另一款工具Nightshade更为激进,它能在看似正常的猫的图片中植入隐蔽特征,从而让模型学到“猫=狗”这样的错误对应。通过这种方式,艺术家们让自己的作品在训练数据中成为“毒药”,保护了原创风格不被复制。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这种反击方式一度在创作者群体中风靡。Nightshade发布不到一年,下载量便超过一千万次。与此同时,基础设施公司Cloudflare也推出了“AI迷宫”,通过制造海量无意义的虚假网页,将AI爬虫困在假数据的循环中,消耗其算力和时间。可以说,数据投毒在某些领域已经从一种反击手段,演变为版权与利益之争中的防御武器。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

去中心化成为AI的防护盾0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这种局面让人警觉。创作者的数据“投毒”是为了保护原创,但一旦同样的技术被用于大规模制造虚假信息,其后果可能比版权争议严重得多。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

面对这种隐蔽的威胁,研究者正在探索新的防御手段。在美国佛罗里达国际大学的Solid实验室,研究人员正着力用去中心化技术来防御数据投毒攻击。其中一种方法叫联邦学习。与传统的集中式训练不同,联邦学习允许模型在分布式设备或机构本地学习,只汇总参数而非原始数据。这种方式降低了单点中毒的风险,因为某一个设备的“坏数据”不会立刻污染整个模型。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

然而,如果在数据汇总环节遭遇攻击,损害依然可能发生。为此,另一种工具——区块链正被引入AI防御体系。区块链的时间戳和不可篡改特性,使得模型更新过程可被追溯。一旦发现异常数据,可追根溯源,定位投毒源头。同时,多个区块链网络还能互相“通报”,当一个系统识别出可疑模式时,可立刻警示其他系统。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

任何依赖现实世界数据的AI系统都可能被操纵。利用联邦学习和区块链等防御工具,研究人员和开发者正在打造更具韧性、可追溯的AI系统,在遭遇欺骗时能发出警报,提醒系统管理员及时介入,降低潜在风险。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干扰,比如用一束红色激光模拟列车尾灯,那么摄像头可能会误以为轨道上已有列车。久而久之,AI学会了把这种假象当作真实信号,并不断发出“轨道占用”的错误提示。最终,不仅列车调度被打乱,甚至还可能酿成安全事故。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

澳大利亚《对话》杂志日前报道称,这是数据“中毒”的一个非常典型的例子。AI系统在学习过程中,如果输入了错误或误导性数据,可能会逐渐形成错误认知,作出偏离预期的判断。与传统的黑客入侵不同,数据“中毒”不会直接破坏系统,而是让AI“自己学坏”。随着AI在交通、医疗、媒体等领域的普及,这一问题正引起越来越多的关注。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

AI“中毒”的现实风险0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在火车站的例子中,假设一个技术娴熟的攻击者既想扰乱公共交通,又想收集情报,他连续30天用红色激光欺骗摄像头。如果未被发现,这类攻击会逐渐腐蚀系统,为后门植入、数据窃取甚至间谍行为埋下隐患。虽然物理基础设施中的数据投毒较为罕见,但线上系统,尤其是依赖社交媒体和网页内容训练的大语言模型中,它已是重大隐患。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一个著名的数据“投毒”案例发生在2016年,微软推出的聊天机器人Tay上线数小时后,就被恶意用户灌输不当言论,迅速模仿并发布到X(当时的Twitter)平台上,不到24小时就被迫下线并道歉。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据英国《新科学家》杂志报道,2024年,互联网出现了一个标志性事件,即AI爬虫的流量首次超过人类用户,其中OpenAI的ChatGPT-User占据了全球6%的网页访问量,它本质上是ChatGPT的“上网代理”,在用户需要实时信息时替他们访问网站。而Anthropic的ClaudeBot更是长期大规模抓取网页内容,占到13%的流量。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

互联网上的大量内容正被AI模型不断采集、吸收,用于持续训练。一旦有人故意投放有毒数据,比如篡改的版权材料、伪造的新闻信息,这些大规模采集的爬虫就可能把它们带进模型,造成版权侵权、虚假信息扩散,甚至在关键领域引发安全风险。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

版权之争中的“投毒”反击0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着AI爬虫的大规模抓取,许多创作者担心作品被未经许可使用。为了保护版权,创作者采取了法律和技术手段。如《纽约时报》起诉OpenAI,称其新闻报道被模型学习再利用,侵犯了版权。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

面对旷日持久的版权拉锯战,一些创作者转向技术“自卫”。美国芝加哥大学团队研发了两款工具。名为Glaze的工具可在艺术作品中加入微小的像素级干扰,让AI模型误以为一幅水彩画是油画。另一款工具Nightshade更为激进,它能在看似正常的猫的图片中植入隐蔽特征,从而让模型学到“猫=狗”这样的错误对应。通过这种方式,艺术家们让自己的作品在训练数据中成为“毒药”,保护了原创风格不被复制。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这种反击方式一度在创作者群体中风靡。Nightshade发布不到一年,下载量便超过一千万次。与此同时,基础设施公司Cloudflare也推出了“AI迷宫”,通过制造海量无意义的虚假网页,将AI爬虫困在假数据的循环中,消耗其算力和时间。可以说,数据投毒在某些领域已经从一种反击手段,演变为版权与利益之争中的防御武器。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

去中心化成为AI的防护盾0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这种局面让人警觉。创作者的数据“投毒”是为了保护原创,但一旦同样的技术被用于大规模制造虚假信息,其后果可能比版权争议严重得多。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

面对这种隐蔽的威胁,研究者正在探索新的防御手段。在美国佛罗里达国际大学的Solid实验室,研究人员正着力用去中心化技术来防御数据投毒攻击。其中一种方法叫联邦学习。与传统的集中式训练不同,联邦学习允许模型在分布式设备或机构本地学习,只汇总参数而非原始数据。这种方式降低了单点中毒的风险,因为某一个设备的“坏数据”不会立刻污染整个模型。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

然而,如果在数据汇总环节遭遇攻击,损害依然可能发生。为此,另一种工具——区块链正被引入AI防御体系。区块链的时间戳和不可篡改特性,使得模型更新过程可被追溯。一旦发现异常数据,可追根溯源,定位投毒源头。同时,多个区块链网络还能互相“通报”,当一个系统识别出可疑模式时,可立刻警示其他系统。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

任何依赖现实世界数据的AI系统都可能被操纵。利用联邦学习和区块链等防御工具,研究人员和开发者正在打造更具韧性、可追溯的AI系统,在遭遇欺骗时能发出警报,提醒系统管理员及时介入,降低潜在风险。0qx速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-13503-0.html数据“中毒”会让AI“自己学坏”

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

比亚迪混动 + 华为车机,赛力斯中型 SUV 蓝电 E5 推出限时优惠:9.98 万元起
3 月 5 日消息,赛力斯集团旗下车型蓝电 E5 日前推出限时优惠政策,3 月 1 日起新车现金最高直降 4.01 万元,限时抢购价 9.98 万元起,活动时间截至 6 月 30 日。该车已于去年 3 月 30 日上市,在售车型为原价 13.99
1月召回909.96万辆汽车,美系占比过半
  中新经纬3月4日电 国家市场监督管理总局日前发布《2024年1月国内外产品召回信息》显示,2024年1月,中国、美国、欧盟、德国、英国、日本、韩国、澳大利亚实施汽车召回216次,召回数量909.96万辆(欧盟未公开数量)。  
欧盟委员会:或对中国电动汽车征收追溯性关税
据路透社报道,日前,欧盟委员会发布紧急通知称,计划开始对从中国进口的纯电动汽车(BEVs)进行海关登记。报道称,此举为欧盟对中国电动汽车发起“反补贴调查”的一部分,若最终调查认定中国电车接受了所谓“不公平补贴”,欧盟
江西委员两会提案:优化高速免费通行政策
近日,全国两会期间,江西政协委员、江西省市场监督管理局副局长谭文英建议:将现行的部分法定节假日高速免费通行政策,调整为每辆车按年享受固定免费通行时长,让公众高速出行更加灵活自由。  谭文英说,部分法定节假日对
马斯克预言要完的新势力 Rivian,新车 R2 一开售,网页就崩了
一款“方盒子”,今天在北美引起热议。Rivian R2 开启预售,车长和 Model Y 相近,动力比 Model Y 更猛,卖得比 Model Y 还贵。配备 11 个摄像头和 5 个雷达,目标实现 L3 级自动驾驶。但是新车交付时间,能不能早于马斯
南财对话丨全国政协委员许玲:广东职教应围绕未来产业优化专业布局、促进学科融合
南方财经全媒体记者丁莉 北京报道今年的政府工作报告提出,过去一年,全国城镇新增就业1244万人;但城镇调查平均失业率仍有5.2%,“就业总量压力和结构性矛盾并存”。广东同时坐拥庞大的高

热点精选

最新推荐

您可能感兴趣