美国采购网DealABC_工业品给世界动力,艺术品给世界温暖

 找回密码
 立即注册

机器发出人类声音?谷歌文本到语音服务厉害了

2018-3-29 01:35| 发布者: dealabc_admin| 查看: 697| 评论: 0

摘要: 机器发出人类声音?谷歌文本到语音服务厉害了 【美国华人网综合报道】谷歌云(Google Cloud )概述了Cloud Text-to-Speech的机器学习服务, ...
机器发出人类声音?谷歌文本到语音服务厉害了

美国华人网综合报道】谷歌云(Google Cloud )概述了Cloud Text-to-Speech的机器学习服务,这款服务由DeepMind的WaveNet支持。
今天推出的Cloud Text-to-Speech服务和研究方法,可以用来为使用语音控制或语音计算的设备、应用程序或数字服务带来更自然的声音。
随着这一举措的实施,开发人员将会获得更多的文本信息,来应用于谷歌助手软件、谷歌搜索、谷歌地图和其他的自然语音技术。
根据谷歌,Cloud Text-to-Speech可以被用于呼叫中心语音应答系统,使物联网设备能够说话,并将基于文本的媒体转换成语音格式。


timg (2).jpg

谷歌Cloud Text-to-Speech提供32种不同的语音,可以说12种语言。用户还可以自定义音高,发音速度,音量增益以及格式等。
谷歌Cloud Text-to-Speech的主要竞争对手将会是Amazon Web Services的Polly,它支持47种声音。
该服务的推出也凸显了谷歌是如何利用Deepmind技术为谷歌云平台服务的。在Cloud Text-to-Speech中使用的Deepmind技术称为WaveNet。一年前,WaveNet将使用语音样本训练的神经网络,从零开始创建原始音频波形。


timg (1).jpg

在给定文本的情况下,WaveNet将会在每次抽取一个样本时生成语音,以保证准确性。
WaveNet使用机器学习从头开始生成音频。它实际上分析了一个巨大的人类语音数据库中的波形,并以每秒24,000个样本的速率重新创建它们。最终的结果包括唇音和口音等微妙的声音。WaveNet于去年10月首次被整合到Google智能助理中(尽管只有日语和英语版本),现在可用于Cloud Text-To-Speech中的精选语音。
但是,随着更新,WaveNet正在谷歌云的TPU基础设施上运行,并且能够比以前更快1000倍地产生原始波形。
除了谷歌的Cloud Text-to-Speech服务和语音识别服务之外,更有表现力的语音技术还可以带来更人性化的Google Assistant。摆脱单调的无音域声音似乎是科技巨头们追求的策略之一,比如Alexa、Siri和GoogleAssistant。
去年,Siri得到了更有表现力的声音。4月份,Alexa为语音应用程序开发人员提供了SSML标签,以提高个人助理的语音能力,比如停顿、耳语或类似“砰”的表情。SSML也已向Google Assistant开发者开放。
(商业转载请联系[email protected],非商业转载请注明转自FuninUSA。)



微信公众号搜索" FuninUSA "加关注,每日滚动更新美国市场讯息:金融、零售、批发。推荐关注!【微信扫描下图可直接关注

美国华人网微信公众号


美国华人网 返回美国华人网FuninUSA,查看更多

【返利网站】返利额度最高的海外购物返利网站TopCashBack:平均返利7~10%,注册就送$10点我注册
新浪微博官方账号】很省钱 : 每日滚动更新美国市场投资资讯微商进货首选资讯渠道。

鲜花

握手

雷人

路过

鸡蛋

相关阅读

关于我们|Archiver|手机版|小黑屋|美国采购网DealABC_工业品给世界动力,艺术品给世界温暖  

GMT+8, 2024-7-6 11:23 , Processed in 0.044681 second(s), 9 queries , Gzip On, Apc On.

Powered by Discuz! X3.1

© 2014-2016 Sky-Express Inc.

返回顶部