“语音引擎”可从15秒样本复制原声

科技日报
290次浏览

据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI称,该引擎自2022年底以来一直在开发中,实际已在ChatGPT应用程序的“大声朗读”功能中应用,该功能顾名思义会向用户朗读相关内容。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

用户只需利用15秒的样本来训练声音,就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示,它可用于教育目的,将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个性化色彩。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“语音引擎”还可为语言障碍者提供支持,例如开发针对语言障碍者的治疗应用,为有特殊学习需求的人提供教育辅助,使用户能选择最能体现其个性的声音,并且对那些使用多种语言的用户,保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI目前并未立即向市场全面推广,而是选择与少数早期测试者谨慎地合作,共同探索“语音引擎”的应用可能和潜在风险。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“语音引擎”目前仅处于有限测试阶段,主要原因是担心被滥用。OpenAI指出,“语音引擎”可能导致语音身份验证措施出现问题,以及让大众在误以为自己与熟人通话的情况下涉入骗局。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI表示希望进行更多研究,以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI称,该引擎自2022年底以来一直在开发中,实际已在ChatGPT应用程序的“大声朗读”功能中应用,该功能顾名思义会向用户朗读相关内容。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

用户只需利用15秒的样本来训练声音,就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示,它可用于教育目的,将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个性化色彩。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“语音引擎”还可为语言障碍者提供支持,例如开发针对语言障碍者的治疗应用,为有特殊学习需求的人提供教育辅助,使用户能选择最能体现其个性的声音,并且对那些使用多种语言的用户,保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI目前并未立即向市场全面推广,而是选择与少数早期测试者谨慎地合作,共同探索“语音引擎”的应用可能和潜在风险。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“语音引擎”目前仅处于有限测试阶段,主要原因是担心被滥用。OpenAI指出,“语音引擎”可能导致语音身份验证措施出现问题,以及让大众在误以为自己与熟人通话的情况下涉入骗局。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI表示希望进行更多研究,以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。rkD速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4523-0.html“语音引擎”可从15秒样本复制原声

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

加快发展新质生产力成今年首要任务 瞄准智能网联汽车、生物制造等新赛道丨解码政府工作报告
21世纪经济报道记者 缴翼飞 北京报道十四届全国人大二次会议3月5日在北京开幕,新质生产力写入今年的政府工作报告,并被列为2024年十大工作任务的首位。21世纪经济报道注意到,新质生产力
每年投入 10 亿美元,剖析苹果汽车项目十年历程:曾计划收购特斯拉
3 月 7 日消息,马克・格尔曼(Mark Gurman)和德雷克・贝内特(Drake Bennett)合作,今天在彭博社上发表了一篇深度报道,回顾和剖析了苹果汽车项目过去 10 年的发展历程。这篇文章为付费文章,本文简要汇总了基于其它媒体
宁德时代曾毓群:电池企业出海要有序竞争
近日,在2024年两会期间,全国政协委员、宁德时代新能源科技股份有限公司董事长曾毓群,针对新能源产业的发展,聚焦重卡电动化、电池与电网双向融合互动(B2G)、工业固废全生命周期管理等热点话题提交了四份提案。  2023
领克 07 EM-P 车型采用“The Next Day”设计语言、关键词“轻盈”
3 月 8 日消息,在目前正在进行的“领克07 EM-P车型全球首秀展示会上”,官方正式介绍了领克07 EM-P车型,可选银 / 蓝双色,不过没有公布具体价格信息和性能信息。外观方面,该车采用“The Next Day设计原则”,号称“为
售价3880元 蔚来推流媒体后视镜选装服务
近日,从官方获悉,蔚来汽车针对ET5、ES6两款车型推出流媒体后视镜选装服务,售价为3880元,并且支持全积分支付(38800分),首批发售限量1000套,预计3月底陆续开始安装。  据悉,此次蔚来推出的流媒体后视镜采用原车线束替换式
全球游戏开发者大会 2024 定档 3 月 18 日召开,微软英伟达腾讯网易等厂商参会
3 月 11 日消息,据全球游戏开发者大会官网消息,全球游戏开发者大会2024(Game Developers Conference 2024)将于北京时间 3 月 18 日至 3 月 22 日在旧金山召开。据介绍,本次大会以“AI”为关键词,官方将围绕相关话

热点精选

最新推荐

您可能感兴趣