首页>>厂商>>交换机/ACD系统平台厂商>>IBM>>语音产品ViaVoice

IBM ViaVoice Telephony——完善的中文电话语音技术

2001/11/14

语音技术,虽然在国外出现得很早,但在国内开始步入实用领域,还是最近的事情。尤其是语音技术在智能电话系统中的应用,国外已经有了不少较大规模的语音识别IVR系统或者呼叫中心的应用,然而在国内,虽然有将语音识别和呼叫中心结合起来的趋势,但仍没有多少应用。目前电话高度普及,如果通过最便捷的电话方式就能查询到所需信息,无疑将给人们的日常生活带来极大方便。虽然影响语音技术在电话系统中应用的因素很多,但重要的一点就是汉语语音识别技术还不够完善。

基于电话的语音识别技术与基于电脑的有很多不同之处。电脑录入使用的是非自然语言,而电话是自然语言。要做好对电话语音的识别,就需要系统能够对男女老少,甚至是带有一些地方口音的各种语言进行识别。并且,电话语音识别系统必须具有处理插入的能力。即允许用户在系统提示时中断系统,但系统依然能知道用户的请求。因为人们在说话时,总是在不自觉地思考,经常会打断语言的连续性,而插入一些补充性的语言。这样的语言,在语法上来说经常是不正确的,常规的语音识别系统很难处理这些语音。

经过多年的研究,IBM公司已经突破了汉语语音识别技术上的重重难关,为智能电话系统提供了IBM ViaVoice Telephony电话语音系统开发工具。作为IBM公司中文语音识别技术的最新成果,IBM ViaVoice Telephony电话语音系统开发工具提供了一个开放式的电话语音识别引擎和完善的应用开发环境,使语音功能可以方便快捷地被集成到电话系统中,为网上声讯服务、电子商务,以及涉及电话通信的应用系统提供语音交互界面。

IBM ViaVoice Telephony中文电话语音技术是IBM ViaVoice中文语音识别技术在电话通信领域中的延伸和发展。它的语音识别引擎采用实际电话信道的语音样本,对于普通电话和移动电话均能获得很高的识别率。由于语音识别引擎没有特定授话人的限制,任何能讲标准汉语普通话的人都可以使用。并且电话语音的应用不但可以运行在单机系统上,更可以扩展为多引擎、多服务器的大型企业级应用,动态的负载平衡能力可以令系统时刻保持最优的效能。

同时,IBM ViaVoice Telephony 电话语音系统开发工具库还为程序员开发和测试电话语音识别应用程序提供了一套完善的实用程序。该工具库对TCL/TK脚本语言进行了扩展,简化了应用程序的开发和定制过程,并提供了与硬件无关的语音识别和语音合成引擎C/C++接口,使得开发人员可以开发面向对象的解决方案。工具库中还包括了若干示例程序,可以帮助用户理解如何将语音识别集成到电话语音应用程序中。另外,软件中还附带了几个实用程序,来协助开发人员开发、测试和管理电话语音识别应用程序。

通过IBM ViaVoice Telephony电话语音识别技术,在许多领域已可以很方便的实现人机语音自动交互服务,例如:信息查询,寻呼台、电话转接中心;金融领域,如家庭银行或股票信息查询;旅游服务领域,如飞机定票或旅馆预定,等。另外随着互联网的迅猛发展,电话轻松上网获取信息,更是广大用户的迫切希望。通过电话上网,用户只需说出想得到的网上信息,机器自动识别,将用户的请求送到互联网上,并把返回的相关信息用语音合成技术回放给用户,提供人性化的语音应答交互界面。

目前,基于IBM电话语音技术,tom.com开发了第一个商用中文语音门户——Tom及时语(http://cn.tom.com/tomvoice)。通过电话语音识别技术,可以使用户用电话访问原来只能通过因特网或内部网的应用;在任何时间,任何地点快速便捷获取所需信息和进行在线交易。

随着中文电话语音应用的推广和深入,针对实际应用的需求,一系列新技术被开发出来。例如,关键词辩识技术可使用户更加自然地和远端服务器交互;针对字母及数字串专用声学模型的建立,为在线语音驱动的电子商务、个性化信息服务提供了有力的保证;针对许多应用中有中英文混合使用的情况,开发了同时支持普通话、台湾普通话、粤语和英语的混合语音技术,进一步拓展了应用的广度。

相信,随着IBM ViaVoice Telephony技术在通讯、金融、旅游以及医疗等领域的进一步推广和应用,将会给人们的工作和生活带来质的变化。有专家预测,随着技术的快速发展,再过10~20年的时间,我们将可以做到非常自然的人机交互式对话。那时,人们的生活必将更加多姿多彩。

IBM供稿 CTI论坛编辑



相关链接:
ViaVoice语音上网新概念 2001-11-14
IBM ViaVoice更方便更健康 2001-11-14
语音识别重在应用 2001-11-14
CRM中的IBM语音技术 2001-10-10
IBM Viavoice:挂在嘴边的输入法 2001-10-10