一.摘要
二.简介
三.发展语音WEB的驱动力
3.1 语音技术的发展
3.2 移动电话的采用
3.3 因特网用户的增长
四.其它支持语音WEB的技术
4.1 传统PSTN
4.2 VOIP技术
4.3 VOICEXML技术
五.新的商业模式
六.NMS通信公司对语音WEB前景的展望
6.1 语音技术的进步
6.2 PSTN接口技术
6.3 VOIP集成技术
6.4 商业利益
七.NMS与语音WEB --- 从现在到未来
7.1 NMS语音门户产品部分客户清单
7.2 NMS在语音WEB领域的合作伙伴
一.摘要
因特网和电话系统的结合产生了一个新的平台:语音门户。通过语音门户,任何人可以在任何地点,通过电话用语言访问因特网的内容或进行电子商务活动。语音门户的应用对于因特网上海量的信息访问提供了一种有效的接入方法。过去通过浏览器才能提供的服务,现在通过最自然的用户界面--语音就可以获得。
本文将讨论语音门户应用的技术和目前发展迅速的语音Web的市场。包括建设和实施语音Web的各种类型的公司介绍和他们应用语音Web的商业模型。详细介绍了如何利用NMS通信公司提供的优秀平台快速构建和实施语音门户。通过一个客户使用NMS技术成功实现语音门户的具体实例,可以了解客户如何从中获益。
二.简介
术语"语音门户(voice portal)"所代表的是一组语音应用,从读出电子邮件到播放交通信息都属于语音门户的应用。B.Elliot,一位在斯坦福Gartner
Group的研究分析专家将语音门户定义为:"一个利用先进语音识别技术,通过因特网提供信息访问的系统。大多数语音门户的核心构件包括语音识别,TTS,信息采集,信息分类软件,电话系统与因特网接口,和维护工具。其它可选的组件包括:支持信息相关性的软件,个人助理(即,智能助手),对VoiceXML协议的支持①"。
总结以上描述,一个语音门户是由一组互相关联的应用组成,用于帮助电话用户通过语音
访问因特网上大量的内容。使用先进的电话系统,语音识别和文本转语音技术,语音门户可以为呼叫者提供e-mail访问,交通信息查询,本地和国内新闻,最新体育消息,股票价格,旅行信息和预定等非常多的应用。语音门户可以作为Web门户的前端语音接口,不管在什么时间,或位于何处,现有Web门户上的所有信息,都可以从任何一部电话获得。
今天的大型语音门户,一般都提供对因特网基本内容的获取功能,例如交通和天气情况,国内或国际新闻,及司机导航信息等。小型语音门户一般用于企业级语音门户,可以为用户提供电子商务信息,例如,购买商品或股票,呼叫中心的客户服务和技术支持,企业内部网中的自动化应用,如日程安排和统一消息等。语音门户很快会提供更多的增强型服务,例如,即时语音消息传送,语音会议和基于位置的服务。
图1:语音门户应用环境
语音门户和语音Web站点正在迅速增加,这种现象产生的原因有以下几种:
3.1 语音技术的发展
首先,最重要一点是,语音技术经过多年的发展,最终达到了用户对语音质量的期望,从而促进了最终用户对这项技术的接受。实际上,TMA协会,一个位于南加里福尼亚的语音产业分析公司,曾经预计仅在电信行业应用语音技术的市场规模,在2003年将达到18亿美元②。
从呼叫者输入方式看,自动语音识别(ASR)已经达到足够可靠的程度,那些最注重实际的商业管理人员已经开始对这项技术感兴趣,ASR的识别准确率已经达到95-97%,或者超过这一范围,这是一个惊人的进步,因为它已经超过真实坐席员的准确度。相对于传统通过双音频(DTMF)话机提供的用户界面,ASR技术的进步提供了"用户友好"的人机交互方式。它可以识别呼叫者说的短语,将语音文字转换为自动系统可以执行动作的指令或信息。新的语音识别功能采用了自然语言理解(NLU)技术,使呼叫者可以使用自己的语言对系统提出请求。
在系统输出端,文本转语音(TTS)技术使计算机可以将ASCII文本合成人类语言,现在声音更自然,易于理解,因此可以促进用户接受这种人机交互方式。由于有了TTS技术,现在,不用将声音预先录制下来,呼叫者就可以听到计算机系统"读出"的各种信息。呼叫者识别软件可以准确、可靠的完成识别用户身份的任务。通过身份识别,可以开展基本的电子商务活动或实现一些个性化的服务。 这些新的发展使越来越多的用户开始接受语音技术。最近一项由Nuance通信公司和Evans研究机构共同做的研究结果发现,87%语音系统的用户对他们的使用结果感到满意,他们通常优先选择语音系统,而不是DTMF或话务员。另外,78%的用户说,语音技术的主要好处在于可以在任何地点获得他们需要的信息,不需要通过音频按键选择复杂的菜单,或等待话务员应答,或花时间登录因特网。98%的用户说他们希望未来继续使用这些语音自动服务。③
通信技术的发展促进了这些语音技术的进步,他们可以带来多种复杂的语音应用,支持数百甚至数千个端口呼入,提供多种类型的ASR引擎,并且支持多语种的各种语音记录和合成功能。
3.2 移动电话的采用
全球范围内移动电话(无线电话)的增长非常迅速。IDC研究机构预测,全球移动电话用户在2005年将超过11亿部④
,此外,汽车制造商开始提供具有语音功能的远程通信服务。例如通用汽车公司的OnStar和福特公司的Winspan系统。
远程通信供应商提供的基于位置的服务来自政府的E911项目,可以提供位置相关的信息访问,例如交通情况和天气消息。大多数汽车厂商很快会将通信设备装入汽车中,可以是用户接入因特网和其它信息服务中心,移动中的用户会习惯于经常使用这些服务。事实上,Forrester研究公司预测,到2005年1.11亿美国人将使用移动数据服务。⑤
此外,Yankee集团,一家位于波士顿的分析公司,也支持这种看法,他们认为电话是提供增值服务的有效手段。根据Yankee集团的研究结果,各种增强型服务,例如语音消息,跟随我(follow-me)服务和寻找我(find-me)服务,个人号码拨号,语音拨号,和寻呼,是目前14%的美国无线用户经常使用的服务。在欧洲,无线服务市场较美国更为强大,Yankee发现40%的无线用户从增强型服务中获益。
3.3 因特网用户的增长
接入因特网的用户正在按指数增长。根据IDC的研究,到2002年,全球因特网用户将超过3亿⑥。同时移动或无线电话数量正在爆炸性的增长,网络的发展使用户可以在任何时候,任何地点获取信息。
以上是促进语音Web市场发展的主要驱动力,然而,技术发展是语音Web成为现实的基础,这些技术主要包括:传统PSTN,VoIP技术和VoiceXML技术。
4.1 传统PSTN
公共交换电话网络(PSTN)为电话通信提供了最主要的接入方法。由于大多数用户习惯于使用电话,这种通信方式会在很长时间内继续成为一种主要方式。典型的PSTN接入包括模拟线路,ISDN,DSL,T1和E1电话线,使用多种协议,如ISDN
PRI,SS7信令。
4.2 VoIP技术
在IP上传送语音是一种混合技术,相对于传统PSTN有很多优点。VoIP是一种低成本的传送语音和数据的方法,这为传统电信运营商和ISP类的服务商提供了新的机会。对VoIP服务的大量需求催生了"聪明"电话系统,网络应用提供商可以为用户提供大量的可视化信息和服务。越来越多的公司正在建造大型商业VoIP网络,这些网络,与PSTN结合,可以为有线和无线电话用户提供网络接入。
4.3 VoiceXML技术
VoiceXML,或语音扩展置标语言,可用于Web门户的开发、测试和建设。VoiceXML论坛是一个由多家公司组成的联盟,主要公司包括IBM,朗讯科技,摩托罗拉和AT&T,主要目标是制定VoiceXML标准。这是XML计划中的一部分,包括建立获取基于Web信息的语音应用,对多平台资源的支持,声频和语音句法格式,和统一资源定位器(URI)的规划。这使开发者不用预先购买或使用设备,就可以建立电话服务系统。⑦
VoiceXML现在已被作为工业标准采纳,国际Web协会(W3C)是因特网标准组织,正在对这个作为开发语音门户应用的标准进行评估。
"Voice Portals: Something Old, Something New", Gartner Group, December, 2000。(引"二") | |
TMA 协会, Tarzana, CA, 1999 (www.tmaa.com)。(引"三-3.1") | |
2000 Speech User Scorecard, Nuance Communications (www.nuance.com)。(引"三-3.1") | |
IDC Research, Framingham, MA, 因特网的无线接入, 1999: "Everybody's Doin' It," 1999年12月 (www.idc.com)。(引"三-3.2") | |
⑤ | Forrester Research, Cambridge, MA, site specific report (www.forrester.com)(引"三-3.2") |
⑥ | IDC Research, Framingham, MA, 因特网经济的发展状态 -- 趋势预测,1998-2003:"投资将加速电子商务的发展," 1999年10月。(引"三-3.3") |
⑦ | 如需进一步了解更多信息,请访问VoiceXML论坛的网站: www.voicexml.org。(引"四-4.3") |