新突破 永利或让机器发人声

使电脑具有“说话”的功能,这在真正的“面对面人机交流”中扮演着很重要的角色。借助于语音合成系统,计算机已经可以清晰、自然地说话,普通用户很容易听懂并接受。然而,现有能说话的计算机往往只能按照一个模式说话。而终端用户却往往对这种能说话的计算机有更高的需求,比如,永利用户可能希望计算机能够以用户的声音进行朗读。这种情况下,如何满足用户的期望使计算机可以按照多种不同风格、不同个性来说话呢?这就要借助于个性化语音生成技术。

据报道 语音生成技术旨在让机器像人一般“自然”发声。据测试,谷歌麾下的DeepMind将机器生成的语音与人声的品质差距缩小了一半。谷歌旗下的永利DeepMind称,在计算机语音生成领域取得巨大飞跃。这一技术进步可能会令机器像人一样“自然”发声的一天提前到来。

新突破 永利或让机器发人声

这家总部驻英国的人工智能分公司的研究人员表示,由人类听众对其系统的测试(尽管这种测试不可避免地带有主观性)显示,该技术将目前计算机系统与人类说话间存在的质量差距缩小了一半。

一位知情人士表示,这一名叫WaveNet的系统尚未被用于谷歌任何产品。该技术在生成语音时需要极大的运算能力,令它在可预期的未来无法实际运用到“真实世界”。

周四,WaveNet相关研究以及一系列该系统生成的语音样本被发布到网上。在近期人工智能方面的角逐中,电脑语音生成受到的关注,不如被称为“自然语言识别”的语言理解领域。

DeepMind研究人员表示:“让人可以和机器交谈,是人机互动领域的长期梦想。”DeepMind表示,通过对声波建模,永利公司可生成模仿任何人声音的语音。DeepMind还曾用音乐测试过该系统,让它根据对经典音乐的分析,创作短小的钢琴片段。

由DeepMind研制的系统今年打败了永利全球顶级围棋选手,从而令该公司赢得广泛关注。对于如何将该公司的人工智能技术用于谷歌的业务,谷歌一直秘而不宣,只表示该技术将谷歌数据中心所需电力减少了40%,并曾“大幅改善从YouTube、Google Play到谷歌广告产品的一系列服务”。

然而,成功让机器人像人一样自然的发声,并不简单。背后所付出的努力,人力物力财力也是非常大的,但若这一技术获得成功,那么其中的获益将是非常大的,永利DeepMind的进步是机器人像人一样自然发声的希望!

正文已结束,您可以按alt+4进行评论

相关搜索:

[责任编辑:wyjoanjiang]

热门搜索:

    广告