首页>>厂商>>系统集成及应用软件开发商>>新太科技

移动语音互联网

2003/09/03

1.1 语音互联网场景

  你会说话吗?会说话就能上网,你不再需要掌握一些基本的输入方式,你不再需要熟悉小小的键盘。张嘴说话,就是你给互联网下达的指令。从PC到WAP到Voice,每一次浪潮都把互联网的门槛降低了一大截。

  也许有一天,我们可以离开PC、离开笔记本,只是随手拨通电话,就可以知道当天发生的国际大事,就可以了解同步的股票行情,还可以知道他乡的天气是否合适旅游。通过手机来上网,以说话来代替键盘输入,以语音控制来代替键盘控制。伴随语音识别和文本语音转换技术、互联网技术、嵌入式技术、CTI等新技术的不断发展,人类用语音征服世界的梦想在逐步实现。我们"说"着上网,"听"网上大千世界。移动语音互联网使我们摆脱了鼠标线的束缚,同时使那些没有电脑的人或有视力障碍的人都能够得到互联网上的信息。

1.2 语音互联网结构



  整个语音互联网由V-ISP接入服务平台、ICGW信息控制关口、V-ICP内容提供平台、管理平台四部分组成。这四部分分别完成不同的功能。

  V-ISP接入信息服务平台、ICGW信息控制服务平台、中心管理平台这三个平台是移动需要在实现语音互联网项目中建设的平台。V-ICP内容提供服务平台则是在现在的ICP网页内容和应用的基础上,通过使用标准的语音解释协议,实现文字信息语音化的平台。新太科技对于移动全网的建设建议是基于对目前移动网络和互联网的理解上建议的。在全国各个省级单位建设一个V-ISP,在全国建设几个ICGW,便于统一管理用户接入和内容接入的问题,有V-ISP完成用户接入,包括接入处理、媒体处理功能,而ICGW完成对于内容提供商的管理,包括接入、内容审核、计费等功能,做到全网用户一点接入,一点交费。而对于内容提供商同样做到一点接入、一点帐务结算。

  作为互联网语音化的核心技术,VXML技术可以实现对文字内容的语音控制。VoiceXML是一个由AT&T, IBM, Lucent and Motorola率先领导及发起的语音标记语言规格。通过VXML运行环境就可以实现网页HTML内容和电话语音的交互。我们在媒体处理模块中内嵌了一个VXML解释器,可以对符合该规范的网页内容按客户的需求进行解释,实现交互服务。

  VXML是一个开放的技术,可以克服传统一个新的业务受开发人员能力的影响的不足。VXML Server把电话、语音、IVR等技术封装起来,业务逻辑则可以分离到Web Server上。这样使得用户可以通过"写网页"的开发方式来开发新业务。业务设计人员从此不需要关心这些业务在技术上如何实现,而开发难度的降低也带来了开发周期的缩短,更复杂的新应用成为可能,让适合做业务内容的厂家真正做自己擅长的工作。

  通过这种方式,各内容提供商则是在现在的ICP网页内容和应用的基础上,通过使用标准的语音解释协议,VXML运行环境结合TTS、IVR、ASR(可选)等媒体资源,实现文字信息语音化的平台。通过VXML运行环境,ICP厂家只需要在远端通过一台WEB服务器编辑好自己的相关业务内容通过Internet即可为移动用户提供服务。真正实现了统一管理,包括接入、内容审核、计费等功能,做到全网用户一点接入,一点交费。而对于内容提供商同样做到一点接入、一点帐务结算。

1.3 业务应用场景
  信息服务类
  交易应用类
  娱乐类
  教育类
  社区服务类等

新太科技公司供稿 CTI论坛编辑