英伟达涉版权侵权诉讼,被指从影子图书馆获取 500TB 盗版数据

环球网
15次浏览

1月21日消息,据AlBase报道,芯片巨头英伟达近日陷入一场备受关注的版权集体诉讼。多位图书作者通过修订后的起诉状指控,英伟达为训练自主研发的人工智能模型,蓄意从“安娜档案馆”等多个“影子图书馆”获取海量盗版数据,涉案数据规模达500TB,包含数百万本受版权保护的图书,相关行为已涉嫌侵犯著作权。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

作为人工智能热潮中的核心受益企业之一,英伟达凭借人工智能训练芯片及数据中心服务的市场需求,营收持续大幅增长。与此同时,该公司也在积极布局自主AI模型研发,推出了NeMo、Retro-48B等多款模型,这些模型的训练均依赖海量文本数据支撑。然而,其数据获取方式的合法性一直备受质疑。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

早在2024年初,就有多位作者以侵犯版权为由将英伟达诉至法院,指控其AI模型使用包含盗版作品的Books3数据集进行训练。英伟达当时辩称相关行为属于“合理使用”,声称书籍对其AI模型而言仅为统计关联数据,但这一说法并未平息争议。随着诉讼推进,原告方在证据开示阶段发现了更多关键线索,并据此提交了修订后的起诉状,大幅扩大了诉讼范围。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

新诉状援引英伟达内部邮件及文件显示,受市场竞争压力驱动,该公司数据战略团队成员曾主动联系“安娜档案馆”——这一目前规模较大且颇具争议的“影子图书馆”,寻求获取数百万份盗版资料,并探讨将其纳入大语言模型预训练数据的可行性。“安娜档案馆”明确告知英伟达其藏书均为非法获取和留存,并要求英伟达高管确认是否已获得内部授权推进合作。令人关注的是,英伟达管理层在知晓数据非法性的数天后,仍于一周内批准了相关合作,“安娜档案馆”随后向其开放了约500TB的盗版数据访问权限,其中包含的数百万本图书,原本多仅能通过“互联网档案馆”的数字借阅系统获取,而该档案馆自身也已身陷相关诉讼。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

除“安娜档案馆”外,起诉状还指出英伟达存在多渠道获取盗版数据的行为,其不仅从“图书馆基因”(LibGen)、“科学枢纽”(Sci-Hub)、“Z图书馆”(Z-Library)等平台下载图书,还向企业客户分发脚本和工具,助力客户自动下载包含盗版Books3数据集的“The Pile”数据库。基于此,原告方新增了辅助侵权与共同侵权两项诉讼主张,认为英伟达通过为他人获取盗版数据集提供便利牟利。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据悉,这是美国大型科技公司与“安娜档案馆”的往来函件首次被公开披露。此前不久,“安娜档案馆”已丢失多个域名,此次与英伟达的侵权纠纷进一步提升了这家盗版图书馆的公众关注度。目前,诉状尚未明确提及英伟达是否向“安娜档案馆”支付了数据访问费用。(纯钧)XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

1月21日消息,据AlBase报道,芯片巨头英伟达近日陷入一场备受关注的版权集体诉讼。多位图书作者通过修订后的起诉状指控,英伟达为训练自主研发的人工智能模型,蓄意从“安娜档案馆”等多个“影子图书馆”获取海量盗版数据,涉案数据规模达500TB,包含数百万本受版权保护的图书,相关行为已涉嫌侵犯著作权。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

作为人工智能热潮中的核心受益企业之一,英伟达凭借人工智能训练芯片及数据中心服务的市场需求,营收持续大幅增长。与此同时,该公司也在积极布局自主AI模型研发,推出了NeMo、Retro-48B等多款模型,这些模型的训练均依赖海量文本数据支撑。然而,其数据获取方式的合法性一直备受质疑。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

早在2024年初,就有多位作者以侵犯版权为由将英伟达诉至法院,指控其AI模型使用包含盗版作品的Books3数据集进行训练。英伟达当时辩称相关行为属于“合理使用”,声称书籍对其AI模型而言仅为统计关联数据,但这一说法并未平息争议。随着诉讼推进,原告方在证据开示阶段发现了更多关键线索,并据此提交了修订后的起诉状,大幅扩大了诉讼范围。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

新诉状援引英伟达内部邮件及文件显示,受市场竞争压力驱动,该公司数据战略团队成员曾主动联系“安娜档案馆”——这一目前规模较大且颇具争议的“影子图书馆”,寻求获取数百万份盗版资料,并探讨将其纳入大语言模型预训练数据的可行性。“安娜档案馆”明确告知英伟达其藏书均为非法获取和留存,并要求英伟达高管确认是否已获得内部授权推进合作。令人关注的是,英伟达管理层在知晓数据非法性的数天后,仍于一周内批准了相关合作,“安娜档案馆”随后向其开放了约500TB的盗版数据访问权限,其中包含的数百万本图书,原本多仅能通过“互联网档案馆”的数字借阅系统获取,而该档案馆自身也已身陷相关诉讼。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

除“安娜档案馆”外,起诉状还指出英伟达存在多渠道获取盗版数据的行为,其不仅从“图书馆基因”(LibGen)、“科学枢纽”(Sci-Hub)、“Z图书馆”(Z-Library)等平台下载图书,还向企业客户分发脚本和工具,助力客户自动下载包含盗版Books3数据集的“The Pile”数据库。基于此,原告方新增了辅助侵权与共同侵权两项诉讼主张,认为英伟达通过为他人获取盗版数据集提供便利牟利。XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据悉,这是美国大型科技公司与“安娜档案馆”的往来函件首次被公开披露。此前不久,“安娜档案馆”已丢失多个域名,此次与英伟达的侵权纠纷进一步提升了这家盗版图书馆的公众关注度。目前,诉状尚未明确提及英伟达是否向“安娜档案馆”支付了数据访问费用。(纯钧)XmN速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-14980-0.html英伟达涉版权侵权诉讼,被指从影子图书馆获取 500TB 盗版数据

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

售价55.98万元,你会为这辆“公路高铁”买单吗?
  中新经纬3月2日电 (刘雪玉)1日下午,推迟3个月的理想首款纯电MPV―MEGA正式上市,售价55.98万元。这款车的上市,意味着理想汽车冲击纯电市场的一个开始。  发布会上,李想透露,包括理想MEGA在内,今年理想汽车推出的每一
将对标电动Macan 疑似揽胜星脉电动版谍照
近日,海外媒体曝光了一组疑似路虎揽胜星脉电动版谍照。新车将对标此前发布的保时捷电动版Macan,预计将搭载800V技术,或为7座布局。此外,此前捷豹路虎集团表示,将在2026年前推出4款电动车。  外观来看,新车预计会采用
1月召回909.96万辆汽车,美系占比过半
  中新经纬3月4日电 国家市场监督管理总局日前发布《2024年1月国内外产品召回信息》显示,2024年1月,中国、美国、欧盟、德国、英国、日本、韩国、澳大利亚实施汽车召回216次,召回数量909.96万辆(欧盟未公开数量)。  
(两会观察)一路疾驰的中国新能源汽车如何“过弯”?
  (两会观察)一路疾驰的中国新能源汽车如何“过弯”?  中新社北京3月5日电 题:一路疾驰的中国新能源汽车如何“过弯”?  作者 李腾飞 苏碧滢 徐雪莹  中国新能源汽车产销量占全球比重超过60%――政府工作报告里
官方认证?蔚来子品牌首车第三方效果图曝光,研发高管称“真像”
3 月 8 日消息,前段时间,蔚来子品牌首款车型的谍照在网上曝光,车玻璃上的贴纸号称“比毛豆 Y 更棒”。新能源汽车社区“新出行”CEO 贺磊随后放出了一张新车的第三方效果图,并称给阿尔卑斯 1(注:子品牌代号)的研发高
首批新能源汽车迎“退役潮” 动力电池回收难题何解?
  (两会声音)首批新能源汽车迎“退役潮” 动力电池回收难题何解?  中新网北京3月6日电(赵晔娇)动力电池行业作为新能源汽车产业中关键一环,近年来需求猛增。然而随着第一批投入市场的新能源汽车面临“退役”,动力电

热点精选

最新推荐

您可能感兴趣