OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

量子位
273次浏览

还帮助病患恢复了声音ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

克雷西 发自 凹非寺ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

有了它,只需15秒的语音样本,就能克隆出一个人的声音,而且还能跨越语言!ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

APP版ChatGPT中的语音对话功能,也正是由这项技术所驱动ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

效果如何?先来听段DEMO:ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Salt also makes sure we stay hydrated which means there is enough water in our body for it to properly function.
盐分也可以保持人体内的水分,确保其满足正常功能的需要。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

【音频效果请移步公众号】ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而OpenAI通告显示,他们在2022年底就已经开发出了这项技术,但出于安全考虑一直没有正式发布。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这次,OpenAI终于官宣了Voice Engine,并展示了小规模测试中的几个应用案例。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

比如,一家非营利医疗机构就利用这项技术,为一名年轻的病人恢复了她的声音。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

另外值得一提的是,去年爆火的视频翻译软件HeyGen,采用的语音引擎也正是Voice Engine。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

那么,这次OpenAI还展现了哪些效果,下面就来一睹为快。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

用AI帮助病患恢复声音

首先是利用基础的语音合成能力,为儿童等不具备文字阅读能力的群体提供阅读辅助ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

比如一家儿童教育技术公司,就一直在使用Voice Engine来给编写好的画外音内容配音。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

DEMO中生成的大段内容,都是基于这样一段15秒的样本:ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

【音频效果请移步公众号】ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

然后,就可以合成相同音色的长段语音:ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

【音频效果请移步公众号】ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

再来看看HeyGen中用到的的语音翻译技术,原始素材是一段英语的音频:ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

【音频效果请移步公众号】ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

它被用原始的音色,翻译成了普通话、法语、德语等多种语言。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

忽略译文的质量,只听声音,中文的效果是这样的:ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

【音频效果请移步公众号】ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

音色保持的还算不错,不过腔调很明显一听就是外国人在说中文。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

至于这到底是个bug还是个feature,就见仁见智了(手动狗头)。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此外,一款名为Livox的残障人士辅助应用,也利用Voice Engine为不能说话的残障人士“发出声音”——ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在有了Voice Engine之后,TA们可以选择专属的真人音色,而不再是机械感明显的合成音,并且在各种语言之间都能保持音色的一致性。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不只是帮助残障人士拥有自己的声音,Voice Engine还可以为因疾病导致声音发生在重大改变的人群,恢复患病之前声音,只要有以前的声音样本就能实现。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一名年轻的患者因罹患血管性脑肿瘤,失去了流利讲话的能力,说话变成了这样:ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

【音频效果请移步公众号】ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

医生从她所在学校录制的视频中提取到了她患病前的声音作为样本,在Voice Engine的帮助下为她恢复了此前的音色。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

【音频效果请移步公众号】ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

此次发布的案例,特别是为不便人士提供帮助的场景受到了不少好评,但也有网友对这项技术的滥用表达了担忧。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

安全问题需要全社会共同关注

实际上,安全问题也是OpenAI迟迟未将这项技术公之于众的主要考量。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

出于安全考虑,前面案例的开发者都经过了OpenAI的严格筛选,并且需要承诺遵守使用协议。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这些开发者被要求必须明确说明声音是合成的,并且设定了黑名单以防止克隆公众人物声音。ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

此外,OpenAI还向合成的声音中添加了水印,以便出现问题时可以进行检测监控,同时呼吁人们采取措施共同应对这一问题:ceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

  • 在银行等敏感信息的安全验证措施中逐步淘汰语音验证方式
  • 探索AI时代下个人声音的保护措施
  • 教育公众理解AI的局限性,并了解其被用于欺诈的可能
  • 加速开发跟踪溯源技术,让人们能够清晰辨别出真人和AI
OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

参考链接:
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voicesceR速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4435-0.htmlOpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

极氪 009 权益升级,新老车主终身免费使用完全智能驾驶辅助系统
3 月 6 日消息,极氪汽车日前宣布,极氪 009 新老车主可0 元升级ZEEKR AD 完全智能驾驶辅助系统,终身免费使用。此前,该服务的价格为 35000 元。目前,极氪 009 已开通 NZP 高速自主领航辅助功能。官方介绍称,在高速及
奔驰与宝马合资公司正式落户北京朝阳区
3月4日,梅赛德斯-奔驰与宝马合资成立的北京逸安启新能源科技有限公司正式落户北京朝阳,将在中国市场运营超级充电网络。以北京朝阳为起点,双方将进一步拓展在中国市场的超级充电网络布局,以满足国内客户对充电服务日
限量150台 斯巴鲁WRX Club Spec Edition
近日,斯巴鲁发布了一张WRX Club Spec Edition的官图。该车型是为庆祝斯巴鲁WRX在澳大利亚上市30周年而推出的,配备STI风格大尺寸扰流板、Brembo刹车和Recaro运动座椅。新车在动力方面并未升级,搭载2.4T水平对置四缸
搭载比亚迪第五代DM-i混动!全新秦L无伪实车曝光:油耗更低
3月9日消息,据“迪粉之家”爆料,近日网络上曝光了接近量产状态的比亚迪秦L路试谍照,该车已经完全去掉了伪装。这款车的定位要高于秦PLUS,同时低于汉,定位于入门级中型轿车,起售价或在12-13万元,最大的亮
住建部部长谈防范房地产风险:对严重资不抵债、失去经营能力的房企 该破产的破产、该重组的重组
21世纪经济报道记者 缴翼飞 实习生 潘晓霞 北京报道3月9日,住房和城乡建设部部长倪虹在十四届全国人大二次会议的民生主题记者会上表示,从全国城镇住房存量的更新改造需求看,房地产还是
住建部再提“房住不炒” 部长倪虹建议以人定房、以房定地、以房定钱
21世纪经济报道记者 缴翼飞 实习生 潘晓霞 北京报道3月9日,住房和城乡建设部部长倪虹在十四届全国人大二次会议的民生主题记者会上表示,构建房地产发展新模式是破解房地产发展难题、促

热点精选

最新推荐

您可能感兴趣