Nuance语音识别技术及解决方案

日期：2014-12-18

核心提示：语音识别技术，Automatic Speech Recognition，简称ASR，是一种让机器听懂人类语言的技术。

1.语音识别概述

语音识别技术，Automatic Speech Recognition，简称ASR，是一种让机器听懂人类语言的技术。语言是人类进行信息交流的最主要、最长用、最直接的方式。语音识别技术是实现人机对话的一项重大突破，在国外近年来发展十分迅速，其应用也逐步得到推广。近几年逐渐普及的IVR(自动电话应答)处理了不少简单而又重复的咨询工作，节省了不少人力，但这种按键式的语音自动应答却让客户花费很多时间按指引来完成简单的查询，令用户倍感不便。

语音识别无疑可以解决该方面的问题。语音识别系统的开发成功，充分发挥了计算机技术和网络技术的优势，采用先进的人机对话方式，摆脱电话按键的束缚，人们只要象平常一样对着电话简单的说出所需服务项目，即可轻松获取自动系统提供的所需信息。

语音识别系统结构

2.语音识别应用

Nuance公司是自然语音接口软件的佼佼者。使用自然语音接口软件，人们可以通过电话方便安全地获取信息、服务并进行交易。每天，千千万万的人通过拨打运行Nuance公司语音识别、语言理解和声纹鉴别软件的电话，进行出游预订、股票交易、与其它通讯媒体、企业和互联网系统进行交往等活动。NUANCE的应用：美国航空、Bell Atlantic、Charles Schwab、家庭购物网络、Lloyds TSB、Sears、UPS 。

3.NUANCE语音识别特点

(1)海量词汇、独立于讲话者的健壮识别功能

Nuance系统能可靠地对多种语言进行大词汇量的识别，并可提供识别结果的置信度。该系统对商业上使用的大量词汇提供最准确的语音识别技术。利用Nuance系统开发的应用程序，在市场上具有最高的准确率。生产中的应用程序经测试，准确性超过96%。

(2)基于主机的客户/服务机结构

Nuance系统基于开放式客户/服务机结构，特别为大型应用程序所需的健壮性和可伸缩性而设计。呼叫者的讲话由客户端收集，而识别和鉴别处理的负载被平均分配到网络上的多个分开的服务器上。

(3)N-Best处理

对于有些应用程序，可能需要识别引擎产生可能的识别结果集，而不是一个最好的结果。Nuance系统的N-best识别处理方法便有这个功能，它提供了可能的识别结果列表，并按可能性从高到低排列。

(4)语法概率

Nuance系统允许对呼叫者所讲的特定词语或短语的在语法中的概率进行指定。当被讲的词语或短语的概率可根据实际使用进行估计时，非常有用。对语法增加概率可提高识别的准确率和速度。

(5)降低噪音

当进来的呼叫包含稳定的背景噪音时，Nuance系统通过一种机制，使识别服务器更准确地进行识别。识别服务器将进来的话语进行增强，以有效地将语气、嗡嗡声、哼叫声、嘘嘘声等噪声过滤。如果相当数量的电话均含有稳定的背景噪声，比如在汽车上免提打电话时，这个机制效果较理想。

4.基于识别的应用

语音短信本身业务、公司电话簿、个人电话簿、智能点歌、股票查询和交易、智能信息点播、列车时刻查询

(1)基于语音识别的公司电话簿

公司电话薄应用描述

系统能支持多个接入号码，虚拟多个公司的总机。并依靠语音识别技术，智能转接到相应的用户。

流程

用户拨打接入码，系统根据接入码找到相应的公司数据库，同时提醒用户说出相应的用户，系统依据相应的用户查询数据库，并得到该用户的号码，并通知交换机将该号码接通。

公司电话簿特点

•系统支持电话接入方式

用户可通过电话修改个人密码，个人上班电话和非上班电话

•系统支持WEB接入方式

• 系统管理员可修改所有信息

• 各公司管理员可增加，删除，修改本公司的电话信息

(2)基于语音识别的点歌功能

功能描述

用户接入系统，提示用户说出歌名，并依靠语音识别技术，查找到该歌名，并播放给用户。

应用流程

用户拨打接入码，提示用户说出歌名或歌手名，并依靠语音识别技术，查找到该歌名或歌手名，若为歌名查询数据库，得到该歌存储的路径，并播放给用户，若为歌手名，则读出该歌手的专辑，并提醒用户选择，用户选择后，读出该专辑的歌名，并提醒用户选择，用户选择后，给用户播放该歌曲

标签： 语音识别

14

更多>同类技术

全年征稿 / 资讯合作

2398080099

联系邮箱：

版权与免责声明

凡本网注明“来源：CK365测控网”的所有作品，均为北京新科时代传媒信息技术有限公司-CK365测控网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：CK365测控网”。违反上述声明者，本网将追究其相关法律责任。
本网转载并注明自其它来源的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。

推荐图文

组装线上的智能型螺丝起子	固态继电器在塑料机械和电子设备中的应用案
西门子SCALANCEX在智能交通行业的应用	西门子SCALANCEX在煤炭行业的应用

推荐技术

可能喜欢

• 基于语音识别芯片LD3320的硬件和软件设计	• 语音识别技术在汽车上的应用
• 麦克风阵列技术在汽车座舱声音增强系统中的应用	• 探秘机器人是如何进行深度学习
• 人工智能公共政策的前景与建议	• 与机器人对话的语音识别解决方案
• 语音识别或成为人机交流的关键	• 看FPGA如何击败GPU和GPP
• FPGA击败GPU和GPP，成为深度学习的未来？	• 语音识别和指纹识别技术到底有多安全？