机器发出人类声音?谷歌文本到语音服务厉害了 今天推出的Cloud Text-to-Speech服务和研究方法,可以用来为使用语音控制或语音计算的设备、应用程序或数字服务带来更自然的声音。 随着这一举措的实施,开发人员将会获得更多的文本信息,来应用于谷歌助手软件、谷歌搜索、谷歌地图和其他的自然语音技术。 根据谷歌,Cloud Text-to-Speech可以被用于呼叫中心语音应答系统,使物联网设备能够说话,并将基于文本的媒体转换成语音格式。 谷歌Cloud Text-to-Speech提供32种不同的语音,可以说12种语言。用户还可以自定义音高,发音速度,音量增益以及格式等。 谷歌Cloud Text-to-Speech的主要竞争对手将会是Amazon Web Services的Polly,它支持47种声音。 该服务的推出也凸显了谷歌是如何利用Deepmind技术为谷歌云平台服务的。在Cloud Text-to-Speech中使用的Deepmind技术称为WaveNet。一年前,WaveNet将使用语音样本训练的神经网络,从零开始创建原始音频波形。 在给定文本的情况下,WaveNet将会在每次抽取一个样本时生成语音,以保证准确性。 WaveNet使用机器学习从头开始生成音频。它实际上分析了一个巨大的人类语音数据库中的波形,并以每秒24,000个样本的速率重新创建它们。最终的结果包括唇音和口音等微妙的声音。WaveNet于去年10月首次被整合到Google智能助理中(尽管只有日语和英语版本),现在可用于Cloud Text-To-Speech中的精选语音。 但是,随着更新,WaveNet正在谷歌云的TPU基础设施上运行,并且能够比以前更快1000倍地产生原始波形。 除了谷歌的Cloud Text-to-Speech服务和语音识别服务之外,更有表现力的语音技术还可以带来更人性化的Google Assistant。摆脱单调的无音域声音似乎是科技巨头们追求的策略之一,比如Alexa、Siri和GoogleAssistant。 去年,Siri得到了更有表现力的声音。4月份,Alexa为语音应用程序开发人员提供了SSML标签,以提高个人助理的语音能力,比如停顿、耳语或类似“砰”的表情。SSML也已向Google Assistant开发者开放。 (商业转载请联系[email protected],非商业转载请注明转自FuninUSA。) 微信公众号搜索" FuninUSA "加关注,每日滚动更新美国市场讯息:金融、零售、批发。推荐关注!【微信扫描下图可直接关注】 返回美国华人网FuninUSA,查看更多 【返利网站】返利额度最高的海外购物返利网站TopCashBack:平均返利7~10%,注册就送$10,点我注册。 【新浪微博官方账号】很省钱 : 每日滚动更新美国市场投资资讯,微商进货首选资讯渠道。 |
关于我们|Archiver|手机版|小黑屋|美国采购网DealABC_工业品给世界动力,艺术品给世界温暖
GMT+8, 2024-7-6 11:23 , Processed in 0.044681 second(s), 9 queries , Gzip On, Apc On.
Powered by Discuz! X3.1
© 2014-2016 Sky-Express Inc.