繁荣背后存隐忧 美AI巨头被控秘密“侵吞”数据

269次浏览

  繁荣背后存隐忧 美AI巨头被控秘密“侵吞”数据89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  记者 张佳欣89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他们无视既定政策,蓄意改变规则,并试图规避版权法。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  收集数据“走捷径”89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  英国《泰晤士报》近日刊文指出,科技巨头一直在“走捷径”为其AI系统收集训练数据。OpenAI开发了一款名为Whisper的语音识别工具,可将YouTube视频中的音频文件转录为纯文本文档,从而创建一个口语对话数据源,帮助训练其下一代基于文本的GPT-4算法。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  美国《商业内幕》网报道称,YouTube在其官网明令禁止“独立”于其之外的应用程序使用其视频内容。而OpenAI的数据并非意外收集的。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  实际上,OpenAI员工知道这样做会涉足法律灰色地带。OpenAI总裁格雷格・布罗克曼甚至亲自参与了所使用视频的收集。但OpenAI依然认为这是合理的,最终获得了超过100万小时的转录视频。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  最大的谜团在于,OpenAI如何访问足够多的YouTube视频来完成这项工作。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  当OpenAI首席技术官米拉・穆拉蒂被问及该公司是否使用YouTube视频来训练Sora时,她表示并不确定。当再次被问及训练数据的来源时,她表示不会透露细节。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  《纽约时报》称,与OpenAI一样,谷歌也转录了YouTube视频,为其AI模型收集文本,这可能侵犯了视频创作者的版权。去年,谷歌还更改了其服务条款。此番动机意图明显,即允许AI对来自谷歌文档中公开可用文档的数据以及上传到谷歌地图的餐馆评论等其他材料进行训练。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  面临“数据瓶颈”89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  对于科技公司来说,庞大的数据“肥料”是生成式AI的核心养分,也是大模型发展的必争之地。唯有足够的数据才能指导技术即时生成与人类创作相似的文本、图像、声音和视频,实现系统创新。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  但随着AI发展,现有互联网信息量的不足、高质量文本数据的匮乏以及科技巨头优质数据的垄断,都可能导致AI“养分不足”。即便谷歌和Meta拥有数十亿用户,每天都会产生搜索查询和社交媒体帖子,但这些数据在很大程度上受到隐私法和自身政策的限制,无法让AI利用这些内容。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  这些科技公司的处境似乎十分窘迫。据人工智能研究机构Epoch称,科技公司最快将于2026年耗尽互联网上的高质量数据。这些公司使用数据的速度超过了产生数据的速度。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  Meta同样也遇到了训练数据可用性限制。该公司打算采取一些措施,例如支付图书许可费用,甚至直接收购一家大型出版商。Meta也曾作出以隐私为中心的变革,因此它使用消费者数据的方式显然也受到了限制。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  在人类数据告急的情况下,不少公司甚至试图用AI“喂”AI。包括微软、OpenAI在内的公司正在把大模型生成的结果,也就是所谓的“合成数据”,“喂”给参数更小的模型。但有研究认为,合成数据最终将让AI“自食其果”。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  因版权被多方状告89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  《纽约时报》去年起诉OpenAI和微软,称其在未经许可的情况下使用受版权保护的新闻文章来训练AI聊天机器人。OpenAI和微软回应称,这属于“合理使用”,或者说是版权法允许的,因为他们为了不同的目的而改造了这些作品。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  去年,超过1万个贸易团体、作者、公司和其他人士向美国版权局提交了有关AI模型使用创意作品的意见。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  生成式AI的迅速兴起引发了一场全球性的高质量数据竞赛。然而,在这个新领域中,关于什么是合法的、道德的,没有明确规定。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  《商业内幕》网称,目前,谷歌、OpenAI和其他科技公司正在辩解,认为将受版权保护的内容用于AI模型训练是合法的,但监管机构及法院尚未对此作出裁决。89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  美国电影制作人、前演员及作家贾斯汀・贝特曼告诉版权局,AI模型在未经许可或付费的情况下获取了其作品内容。她称,“这是美国最大的盗窃案”。(科技日报)89b速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4940-0.html繁荣背后存隐忧 美AI巨头被控秘密“侵吞”数据

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

将可城可野 全新一代北京BJ30官图发布
3月6日,从北京汽车官方获取到了旗下轻越野SUV——BJ30车型官图。作为“悦旅”系列的首款车型,该车将搭载魔核混动、超级电四驱等配置。同时,该车已于此前完成申报,采用当下流行的“方盒子”造型,整体看上去硬朗且时尚
3月7日正式亮相 RIVIAN R2最新预告图
RIVIAN旗下更便宜的SUV车型—RIVIAN R2将会在当地时间3月7日正式亮相,新车的更多预告图公布。该车采用纯电四驱系统,续航里程或达到483km以上。RIVIAN R2或于2026年在美国上市,售价预计在4.5-5万美元之间,约合人民币3
专访全国政协委员、中国社科院副院长王昌林:5%的增长目标是可行的,也是必要的|解码政府工作报告
21世纪经济报道记者 杨志锦 北京报道 3月5日,十四届全国人大二次会议在京开幕,国务院总理李强作政府工作报告。就政府工作报告提出的经济增长目标、财政货币政策定调及发展新质生产力
北汽集团:将在韩国高阳建造电动汽车工厂
近日,从海外媒体获悉,韩国高阳市政府已与中国汽车公司北京汽车签署谅解备忘录,将在高阳自由经济区所在地建设大型电动汽车生产设施。该工厂年产能目标为20万台,计划将90%的电动汽车出口到韩国以外市场。  据悉,北京
MEGA被网友“P图”为殡仪车,理想汽车发函称侵犯名誉权
  MEGA被网友“P图”为殡仪车,理想汽车发函称侵犯名誉权  理想汽车旗下MEGA推向市场后因其外观陷入舆论漩涡。  近日,一名汽车博主在网络上曝出一则理想汽车向某平台投诉的通知函。该通知函显示,2024年3月2日,今日
搭载比亚迪第五代DM-i混动!全新秦L无伪实车曝光:油耗更低
3月9日消息,据“迪粉之家”爆料,近日网络上曝光了接近量产状态的比亚迪秦L路试谍照,该车已经完全去掉了伪装。这款车的定位要高于秦PLUS,同时低于汉,定位于入门级中型轿车,起售价或在12-13万元,最大的亮

热点精选

最新推荐

您可能感兴趣