美国采购网DealABC_工业品给世界动力,艺术品给世界温暖 › 首页 ›产品新闻 › 查看内容

机器发出人类声音?谷歌文本到语音服务厉害了

2018-3-29 01:35| 发布者: dealabc_admin| 查看: 697| 评论: 0

摘要: 机器发出人类声音?谷歌文本到语音服务厉害了【美国华人网综合报道】谷歌云（Google Cloud ）概述了Cloud Text-to-Speech的机器学习服务， ...

机器发出人类声音?谷歌文本到语音服务厉害了

【美国华人网综合报道】谷歌云（Google Cloud ）概述了Cloud Text-to-Speech的机器学习服务，这款服务由DeepMind的WaveNet支持。

今天推出的Cloud Text-to-Speech服务和研究方法，可以用来为使用语音控制或语音计算的设备、应用程序或数字服务带来更自然的声音。

随着这一举措的实施，开发人员将会获得更多的文本信息，来应用于谷歌助手软件、谷歌搜索、谷歌地图和其他的自然语音技术。

根据谷歌，Cloud Text-to-Speech可以被用于呼叫中心语音应答系统，使物联网设备能够说话，并将基于文本的媒体转换成语音格式。

谷歌Cloud Text-to-Speech提供32种不同的语音，可以说12种语言。用户还可以自定义音高，发音速度，音量增益以及格式等。

谷歌Cloud Text-to-Speech的主要竞争对手将会是Amazon Web Services的Polly，它支持47种声音。

该服务的推出也凸显了谷歌是如何利用Deepmind技术为谷歌云平台服务的。在Cloud Text-to-Speech中使用的Deepmind技术称为WaveNet。一年前，WaveNet将使用语音样本训练的神经网络，从零开始创建原始音频波形。

在给定文本的情况下，WaveNet将会在每次抽取一个样本时生成语音，以保证准确性。

WaveNet使用机器学习从头开始生成音频。它实际上分析了一个巨大的人类语音数据库中的波形，并以每秒24,000个样本的速率重新创建它们。最终的结果包括唇音和口音等微妙的声音。WaveNet于去年10月首次被整合到Google智能助理中（尽管只有日语和英语版本），现在可用于Cloud Text-To-Speech中的精选语音。

但是，随着更新，WaveNet正在谷歌云的TPU基础设施上运行，并且能够比以前更快1000倍地产生原始波形。

除了谷歌的Cloud Text-to-Speech服务和语音识别服务之外，更有表现力的语音技术还可以带来更人性化的Google Assistant。摆脱单调的无音域声音似乎是科技巨头们追求的策略之一，比如Alexa、Siri和GoogleAssistant。

去年，Siri得到了更有表现力的声音。4月份，Alexa为语音应用程序开发人员提供了SSML标签，以提高个人助理的语音能力，比如停顿、耳语或类似“砰”的表情。SSML也已向Google Assistant开发者开放。

（商业转载请联系[email protected],非商业转载请注明转自FuninUSA。）

微信公众号搜索" FuninUSA "加关注，每日滚动更新美国市场讯息:金融、零售、批发。推荐关注！【微信扫描下图可直接关注】

美国华人网微信公众号

返回美国华人网FuninUSA，查看更多

【返利网站】返利额度最高的海外购物返利网站TopCashBack：平均返利7~10%，注册就送$10，点我注册。
【新浪微博官方账号】很省钱 : 每日滚动更新美国市场投资资讯，微商进货首选资讯渠道。

鲜花

握手

雷人

路过

鸡蛋

收藏邀请

		自动登录	找回密码
密码			立即注册

机器发出人类声音?谷歌文本到语音服务厉害了

相关阅读

相关分类