亚马逊Alexa:训练TTS系统合成语音 多扬声器比单扬声器更自然

亚马逊Alexa:训练TTS系统合成语音 多扬声器比单扬声器更自然

智东西(公众号:zhidxcom)编 王小溪

导语:亚马逊Alexa部门的科学家在一项新研究发现,用多个扬声器数据训练的AI语音合成系统TTS合成的语音会更自然。

智东西4月26日消息,据外媒报道,亚马逊Alexa部门的科学家在一项新研究发现,用多个扬声器数据训练的AI TTS(Text To Speech,文本转语音)系统要比在单个扬声器模型上训练更多样本产生更自然的语音。而且,前者模型整体上更稳定:它减少了系统少词、发出嘟声的频率,也避免了系统连续重复单音时出现卡顿的情况。

该研究将于下月在布莱顿举行的声学、语音和信号处理国际会议上展示。

随着复杂的自然语言处理的出现,TTS系统变得越来越高效。以Google的Tacotron 2为例,它可以仅基于频谱图构建语音模型。不过,这些神经TTS(NTTS)方法的一个缺点是它们需要比传统方法更多的数据。

Alexa Speech应用科学家Jakub Lachowicz在博客文章中写道:最近研究表明,用不同扬声器数据训练NTTS系统时,所需要的数据更少,而产生的结果会更好。

亚马逊Alexa:训练TTS系统合成语音 多扬声器比单扬声器更自然

正如Lachowicz所解释的那样,NTTS系统通常由两个神经网络组成。第一个将文本的语音转换为梅尔频谱图;第二个网络是声码器,将梅尔频谱图转换为更细粒度的音频信号。

在对70名听众的测试中,研究人员发现,用来自七个不同扬声器的5000个语音数据训练出的模型比用来自单个扬声器的15,000个语音数据训练出的模型合成了更自然的语音。

在一个测试中,研究者向听众展示了人类讲话的现场录音,和用2种TTS模型合成的语音,并询问他们两段语音是否相同。结果,NTTS系统在多个扬声器上训练效果与在单个扬声器上训练效果表现一样。更不可思议的是,研究者们也没有观察到用不同性别的人类语音和同一性别人类语音训练出的模型在自然性方面存在任何统计学差异。

最后,研究者还发现在多个扬声器上训练的模型比在单个扬声器上训练的模型更稳定。NTTS系统有时会丢失单词,发出嘟声,它们会在重复单个声音时卡住。而多扬声器模型比单扬声器模型更少地表现出这些误差。

Lachowicz指出,用超过15,000个训练样本训练的时候,单扬声器NTTS模型将开始优于多扬声器模型。可以肯定的是,Alexa当前语音的NTTS版本训练所用的样本已经过超过15,000个。但混合模型可以使开发人员更容易获得合成声音。

他认为,在多个扬声器中训练NTTS系统可以用更少的数据产生更好的结果。这表明以后不需要录音者花好几天在录音棚中录音,便能使扬声器提供各种可定制的语音风格。

Lachowicz博文地址:https://developer.amazon.com/zh/blogs/alexa/post/83dd06f2-d7d6-4a55-8b4f-1c443c1e483c/training-speech-synthesizers-on-data-from-multiple-speakers-improves-performance-stability

文章来自:Venturebea

免责声明:本文作者:“作者”,版权归作者所有,观点仅代表作者本人。本站仅提供信息存储分享服务,不拥有所有权。信息贵在分享,如有侵权请联系7780@88.com,我们将在24小时内对侵权内容进行删除。
(179)
谷歌发布TTS系统Tacotron 2,
上一篇 2024年01月21日
31.55吨黄金!河南发现特大金矿,金矿
下一篇 2024年01月21日

相关推荐

  • 最新财税政策

    财税最新政策主要有:1.符合条件的小型微利企业,减免企业所得税。2.对金融机构向小型企业、微型企业和个体工商户发放小额贷款取得的利息收入,免征增值税。3.抓紧出台居民个人经常项目投资汇兑管理办法。4.修订企业外债管理办法。5.对稀土、钨、钼资...

    2024年01月02日
  • 北京公证处-在线公证平台

    现在很多人都在北京打工,当需要做公证的时候,因为对北京当地不熟悉,不知道公证处的位置,小编来帮你的忙,外地人在北京如何做公证,北京公证处在哪里,这里都有答案。首先是北京公证处的相关介绍。北京市公证处,创建于1950年,是北京地区成立最早、规模...

    2024年01月06日
  • 名模俞林莉分享海滩写真,身穿金色露脐连衣裤,勾勒出窈窕的身姿

    近日,名模、环球小姐俞林莉在社交平台分享一组写真,并留言:海边漫步,发现一个洞穴和一片沙滩隐藏在山谷里。我们看到这组写真中,俞林莉身穿一套金色闪片X型吊颈露脐连衣裤,在海岸边以及山洞拍摄写真。这是俞林莉在海岸边拍摄的写真。我们看到俞林莉的这套...

    2024年01月13日
  • 售价2599元 一键AI更快 海信AI手机H20发布

    6月26日,海信在青岛国际会议中心召开发布会,正式发布了海信AI手机H20。这次发布会的主题就是发现更美的视界,这款海信AI手机H20也是主打全面屏的设计,正面一块5.8英寸的异形全面屏让手机的视野更大,在小巧的身材中,加入了更大的屏幕显示区...

    2024年01月29日
  • 试驾起亚新一代K2:十万级活力轿车再升级

    在国内汽车行业,单款车型月销过万是一个非常了不起的数字。如果这个数字是一款小型车创造的,那么销量数字背后的含金量将会更高。东风悦达起亚K2自上市以来累计销量76万台,年均销量14万台以上。东风悦达起亚K2早已牢牢挺进万辆俱乐部。作为一款成功小...

    2024年03月17日
返回顶部