首页>>厂商>>语音板卡开发商>>NMS

开发ASR应用系统的相关技术和发展趋势展望

NMS大中华区总经理 何育麟 2003/05/21

  当前,许多公司纷纷在他们的呼叫中心和交互语音应答应用系统(IVR)中采纳语音识别技术,用来降低运营成本和提高客户服务水平。计算机处理性能的突飞猛进和不断改进的运算方法为语音识别技术的应用创造了良好的基础。目前的语音识别技术可以识别多种语言的上百万单词,并可以达到90%以上的准确识别率。用语音技术完全替代键盘来操作计算机可能还需要相当一段时间,但这项技术已经快速的应用到了许多垂直市场的呼叫中心自动化方面,如:金融服务、目录服务等行业。

  Kelsey集团在它的《2002语音生态系统》报告中预测,ASR商业应用在未来5年的年增长率将达到34%。尽管这项报告的研究数据与当前市场的发展现状相比略显滞后,但是它指出了当前市场的发展趋势。报告指出,供应商们必须清醒地意识到,当前的市场需要的是能够切实满足业务需要的解决方案,因而供应商们必须为他们的语音应用方案提供可信的投资回报分析。该报告预测,2005年语音应用市场的规模为410亿美元。

语音识别技术在网络和企业中的应用

  在企业,目前至少有70%的业务处理是通过电话进行的,而移动通讯所占的比例正在不断上升。企业需要满足客户对高质量服务的要求,同时也需要通过提供可增强CAPEX的服务来获取竞争优势,在向客户提供更好服务的同时,提高投资回报率。

  在网络应用方面,电信运营商们可以提供各种语音增强服务,如:语音驱动拨号、可通过语音控制的语音邮件和日程表、支持语音的统一消息服务、目录助理、电话会议管理等等。语音门户应用采纳了大量的语音识别技术,可以提供非常广泛的服务,尤其是针对移动用户。

发展新趋势

  在几年前,语音识别技术还仅仅局限应用于IVR系统升级上。最近,开发商SpeechWorks、Nuance和IBM纷纷推出了更进一步的应用。由SpeechWorks和Convergys公司于2002年上半年组织的一次调研结果显示,大多数呼叫中心机构有采用新型ASR应用系统的计划,而不再愿意升级现有的IVR应用系统。这意味着相关应用不仅横向可以扩大新的顾客群,纵向也可以向老客户推出新的应用系统。许多公司都希望采用简洁的语音识别技术来改进细分市场的服务,并降低经营成本,相关的细分市场包括移动数据接入和呼叫中心自动化等。其它语音应用包括:语音驱动拨号、语音邮件、电子邮件阅读器、日程管理和聊天室。上述应用的实现得益于当今相关技术的进步,包括:更快的芯片处理速度、改进的算法、多语言和语调研究、以及大容量的词汇库。

ASR应用系统基础

  下图显示了采用NMS平台产品的ASR应用平台总体结构。


  构筑ASR平台的基础通信硬件包括NMS公司的AG 2000、AG 4000和CG 6000系列板卡。
  NMS公司的Natural AccessTM API 应用接口为电信硬件提供了非并行编程的灵活性。
  特定供应商提供的ASR/TTS客户端软件组件。
  特定供应商提供的ASR/TTS服务端软件组件,可提供语音识别或文本朗读引擎。
  系统集成商和OEM厂商提供的应用管理软件。
  注:本图只是应用系统的逻辑显示。整套系统可以安装上单台计算机上,也可以分布在多台服务器上。

NMS公司提供的集成解决方案

  ASR和TTS是NMS公司CG系列(Convergence Generation™ )和AG系列(Alliance Generation®)板卡的可选功能。采用Natural Access API应用接口,语音功能可以与同一块板卡上的传真、会议应用、IP功能、呼叫处理、转移等其它NMS处理功能相集成,这样就可以采用CG系列和AG系列板卡开发功能强大、经济和灵活的电信和增强服务解决方案。

  采用单插槽的CG系列和AG系列DSP及接口板卡,NMS公司可提供配置有一系列高端语音处理技术的系统平台,并拥有无与伦比的尺寸、多样性和产品质量。

  开发商开发具有语音功能的应用系统,可以选择不同的供应商、不同复杂程度的技术、不同操作系统、以及现有各种算法均支持的语言。NMS的体系结构可以帮助开发者在众多的语音技术领先开发商中选择最佳的语音应用解决方案。这些语音技术供应商与NMS公司合作,提供了完整的、高性能的语音集成方案,为语音应用系统提供统一的开发环境和与其它语音应用系统应用的底层集成。

  该开发平台不仅提供集成的电话和语音API应用接口,还提供应用于IVR和呼叫中心的关键功能,包括:
·IP和PSTN之间的连接
·可扩展性
·板卡内置的增强回音消除处理功能,用于增强语音识别、双音多频和音调侦听
·语音重放时干涉信号的监测
·同步进行播放和录音的全双工功能
·基于DSP的语音活动侦听(VAD,Voice Activity Detection)算法,可以显著提高语音应用系统的整体性能。(Natural Access 2003-1版提供)

NMS技术的适用范围

  AG 2000 AG 4000 CG 6000系列
小型、语音驱动的自动服务台
   
中规模公司的消息应用服务器  
 
混合网络 and/or 大型电信级应用    


  NMS技术为研制ASR应用系统的开发商们提供了各种需要的功能,包括:各种领先的语音识别技术、解决实际应用问题的回音消除处理和barge-in优秀功能、可支持传真、会议应用和语音的通用接口,这些功能完全集成在一块板卡上,可扩充应用系统到上千个接口,并可以低成本的、快速把应用方案推向市场。

NMS公司供稿 CTI论坛编辑



相关链接:
Sun X4250 和X4450主板上的NMS板卡及NA 8.0 的使用 2008-10-31
NMS公司SS7 5.0 软件现在正式发布 2008-10-29
NMS TX 5000e系列扩充了基于PCI Express的SS7产品线 2008-10-27
南非市场开始推广移动视频应用 2008-09-25
TouchStar呼叫中心支持NMS Open Access媒体处理平台 2008-09-23

分类信息:  语音板卡_与_语音识别ASR  语音板卡_与_语音识别ASR     文摘   技术_语音板卡_新闻   技术_语音板卡_文摘   技术_语音识别_文摘