贵州新闻网

首页 > 正文

搜狗发布“个性化语音识别”,能知人善察你的每句口头禅

www.zqzskl.com2019-08-25
?

专业机构发布的《2019年语音技术》报道称,语音将成为未来十年的决定性主题之一,再加上人工智能,从根本上改变人与机器之间的关系。近日,搜狗输入法首次在语音输入领域引入“个性化语音识别”功能,突破语音识别技术的瓶颈,大大优化了个人词汇录入的直接准确性,实现了“对用户的更多了解”。在语音输入领域。

img_pic_1565854076_0.png

搜狗“个性化语音识别”创建用户特定的输入法

在日常交流中,个人咒语和习语经常干扰双方之间的信息交流。这个问题在人机语音交互中尤为突出。在语音输入中,用户通常只想输入名称,但输入结果显示另一个结果,即音调不同。例如,当用户希望输入方法显示“到目前为止”的人名时,一般语音识别通常列出候选词汇表最前面的公众常用的“普通,来源”,以及用户的个性化内容不在其中。另外,用户习惯使用的个人词汇,以及一些复音词和发音错误,也影响语音识别结果。

基于以上原因,搜狗语音开创了语音识别技术的创新,推出了“个性化语音识别”服务。在这一轮更新之后,用户只需使用Sogou输入法App登录其个人帐户即可体验此服务。在成功打开之后,“个性化语音识别”将通过增强学习用户使用的个人词汇为每个用户创建定制的语音输入方法。此后,当用户需要输入语音时,输入法将根据语言环境和上下段分析文本,并快速输出符合用户心意的文本内容,有效降低用户手动第二次更改的频率。

搜狗的声音天生具有“黑技术”,语音识别更准确

搜狗的“个性化语音识别”不仅可以有效提高个性化词汇的识别准确率,而且自动词汇学习的特点极大地保证了系统的处理和反馈速度,实现了整个过程中学习个性化特征的过程。毫秒级别可以自动完成。

通过DTSS(基于深度变压器的序列到序列模型)端到端声学模型,神经网络语言模型和智能标点预测技术,搜狗输入法有效地引入了尖端的深度学习技术,语音识别的仿真和训练。提高语音输入在常见场景中的准确性已达到业界领先优势。 “个性化语音识别”可以基于用户数据分析扫描和记录用户习惯的个性化短语。当语音输入时,优先选择用户习语用于文本输出。通过这种技术创新,在保证通用识别准确性的前提下,用户常用词的词错误率降低了40%,克服了准确语音识别的技术难度。

通过个性化语音识别控制AI

手和舌头是人类最灵活的两个部分。自从移动智能设备的发展以来,各种触摸交互依赖于手动操作。当语音技术和人工智能同时成熟时,也许如《2019语音技术报告》所述:语音交互颠覆了现有的人机交互形式,并开始建立基于用户和设备之间语音交互的新关系。正如互联网已经转向移动互联网一样,它对底层平台的新需求也在酝酿之中。

新时代即将来临。响应于人工智能,虚拟现实和其他技术的创新,以及使用不同维度和多个场景的需要,用户输入方法的使用习惯逐渐转向语音输入。同时,与文本输入相比,语音输入注定成为最重要的人机交互界面。优化语音识别技术,为用户提供更自然,更方便,更高效的语音输入服务是智能输入法的发展趋势。

随着语音识别技术的不断成熟和用户个性化词汇的不断丰富,搜狗将聚合用户级语音个性化资源,实现“定制语音输入法”。基于搜狗语音识别“定制版”和“更了解自己”的支持,每个用户都可以有效提高日常生活,医疗和法律领域的在线交流和人机交流的效率和准确性,或者成为全球人工智能时代输入的控制器。

热门浏览
热门排行榜
热门标签
日期归档