首页 > 技术 > 技术文摘 > 语音识别技术——电子商务的 “推进器”

语音识别技术——电子商务的 “推进器”

2001-06-29 00:00:00   作者:   来源:   评论:0 点击:


 

“Speech Technology is The Next Big Thing in Computing!(语音技术是计算机行业的下一个重点)”这句曾经出现在美国《商务周刊》封面上的论点,给记者留下了十分深刻的印象。从目前的技术来看,要使高科技的IT产业真正走向大众生活,充分利用语音技术、将语音技术与数据技术结合是必然趋势。言丰科技的梁康忠博士说:“语音技术是当今迅猛发展的电子商务经济最重要的‘推进器’之一,该市场正在迅速成长,且发展势头良好。”有国外的分析家预测,从2000年到2005年,语音技术市场将以每年31%的速度持续增长。语音技术市场的迅速扩展,意味着我们正面临着大量部署语音应用的转折期。

提到语音技术,更应该强调语音识别技术。因为只有系统能够自动识别语音内容,才能真正实现全程智能化、自动化。同时,只有当大家真正认识到语音识别技术在通信系统中所起到的核心作用时,才标志着语音应用进入到了一个新的阶段。

以往,我们都比较熟悉IBM的ViaVoice等个人识别软件,但真正带来最大利润的还是企业级语音识别软件。企业级语音识别软件往往可被扩展为一个平台,集信息查询、信息点播、交易处理、统一消息四大功能模块于一体,很多人称之为语音门户。目前,常见的语音解决方案的供应商主要是IBM、Nuance、SpeechWorks、Philips,以及香港言丰科技。

在很多人对实现语音功能颇为挠头的时候,言丰科技高级系统开发经理周鲁生却说:“语音识别技术的门槛其实不高。”语音识别技术需要对语言规律的高度理解,因此,对于汉语识别系统,中国的公司在核心模块二进制级别对汉语的双字节处理上要具有很多优势。并且,源语音采集库的规模直接决定语音识别的范围和精确性,中国公司在这方面要大大占先。

现在,很多语音技术大多如此:先跟着指导练习一段时间,相当于与系统的“磨合”,然后再根据系统的提示,在“嘀”声后开始说话,一问一答地完成此过程。语音识别的难度在于突破这种传统的非人性化、非灵活性的语音环境,实现一些新功能,包括:说话者可以随时开口,而相应系统随时都可觉察并录制、识别;说话者可以多种方言甚至多种语种输入,而系统能够识别出来;说话者在噪音非常大(甚至与说话者音量相当)的环境中说话,系统能识别出来等。言丰科技的语音识别系统目前已经能实现这些功能,人工智能会话断插(barge-in)、多语音混合识别和回声消除等,已使语音识别技术正在进一步获得突破。

梁博士认为,语音识别只是一种技术手段,它的应用不能脱离应用主体去单独实施,否则,语音技术开发者就不可能承接好各种应用项目。因此,在推动企业应用语音系统开展商务活动和进行内外部管理的时候,必须让集成商介入这个领域。而且,由于旧有的语音应用还处于一个比较低级的阶段,技术上的突破将会给这个领域带来重新洗牌的机会。

摘自《中国计算机报》

相关阅读:

分享到: 收藏

专题