加载中 ...
首页 > 新闻资讯 > 经验心得 正文

搜狗创新发布微信第一个个性化TTS小程序——“故事王”

2019-07-12 21:45:59 来源:沈阳小程序开发 作者:沈阳软件开发

【猎云网(微信:)沈阳】6月19日报道

最近,搜狗推出了一款名为“故事之王”的小程序,它基于搜狗同伴引擎的语音合成能力,首先将个性化TTS技术放入微信。在用户根据提示录制约5分钟的短音频后,“搜狗故事王”小程序将自动生成用户的个性化合成声音,孩子们可以听到父母的声音讲述的童话故事。

这样一个实用的腰带武器是一个神奇的武器吗?那么如何快速准确地定制用户的个性化声音呢?你如何使用合成声音向孩子讲故事?

颠覆传统“机器音”,搜狗独家提供个性化TTS技术

在专业领域,技术人员将“文本文件的实时转换”称为TTS功能。还记得点读机“它不会在哪里?”这个曾经流行的儿童英语学习工具使用此功能。钢笔读取笔扫描文本内容,然后通过点读机将其读入成人声音。在电子书阅读,语音导航,语音提示等其他领域,TTS功能也被广泛使用,但它们有一个共同的缺点,即只能实现文本到特定声音模板的转换,而且音质相对僵硬。 软件

ad.jpg

机器感觉很饱满。

使用过“Sogou Story King”的用户知道在这个小程序上,用户可以自定义他们自己的个性化合成声音。然后,您可以通过手机随时随地向孩子们讲述故事。它听起来像一个声音,自然而流畅,明显不同于以前的机器声音。

这要归功于Sogou配套引擎最初创造的独特TTS合成技术。与传统技术相比,“搜狗故事王”具有很高的表现力,往往是一个真正的人口。此外,除了可自定义的声音外,您还可以使用此声音来实现任何文本的合成。搜狗是一家成功结合这两项技术并成功登陆的公司。

依靠个性化的TTS技术,“搜狗故事王”对用户录制声音的要求很低。它不需要去专业的工作室,也不需要记录很长时间。用户只需约5分钟的操作时间,Sogou的背景技术模型可以自动准确地消除噪音,完美复制原始声音数据,并合成定制的个性化声音。合成音调的阅读效果与真人的阅读效果非常相似,并且可以以“虚假和真实”的方式实现。

坚持创新,克服难关,个性化定制终实现

搜狗独有的个性化TTS技术在技术开发方面面临诸多挑战。

首先,声源的清晰度直接影响后续声音的定制。然而,在日常生活中通过普通记录设备难以收集具有低噪声和清晰声音的声源是不可避免的。个性化TTS技术集成了许多先进的尖端技术,如信噪比检测,口语评估,识别,降噪,去混响,高稳定性声学参数提取和模型适应,以及深度学习平台。在此基础上,取得了突破。最终,“搜狗故事王”终于发出了满意的答复,让用户不需要去专业工作室录制,在卧室,会议室甚至汽车等常见环境下均可用于声音采集。

100218hericeee1incwhke.png

(搜狗个性化TTS技术)

其次,如何给机器声音提供情感情感也是一个技术难题。人类具有丰富的表达语言和情感的能力,因为人类大脑皮层中有140亿个神经元。模拟这样的人工智能大脑是不可能的。但搜狗的研发团队发现了另一条发展道路,一种基于人工智能的新技术,即——多目标学习技术。该技术可以同时学习三个目标对象,即表示音调的“扬声器编码器”,表征内容的“文本编码器”,以及表达表现力的“样式编码器”。将情感注入刚性合成声音,使其听起来更逼真。

最后,搜狗还采用了国际领先的波形合成模型WaveRNN,使最终输出音质有了更好的效果。

此时,“搜狗故事王”小程序可以完美地实现用户声音的个性定制,并通过这种AI合成声音,将故事告诉孩子们。作为搜狗在人工智能领域的配套引擎开发的新应用,“故事之王”为当代人的日常生活提供了更多便利,也为智能技术研究领域提供了新的课题,如未来的劳动力。智能机器人的发展为语言系统的构建提供了参考,使机器人更加情绪化,电影和电视剧中智能未来的分享将成为现实。

“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。