统一消息平台中的语音技术

北京炎黄网络科技有限公司 陈颖 柳呈文

2001/06/04

目前,各种各样的通信设备及信息在给我们带来方便的同时也带来一些麻烦,信息多了,通信设备多了,使用也变得复杂化了。怎样简化我们获取信息的方式,让信息无所不在,这就是目前统一消息平台所要解决的问题。另外,针对中国目前互联网用户只有1600万,而电话用户已经达到了1.6亿户的现状,统一消息平台为传统的电话用户拓展了信息获取的范围,也就是说,电话用户可以通过传统的语音、传真获取互联网上无穷无尽的信息。

统一消息平台集成了固定电话网、移动电话网和Internet网络。目前,电话网和Internet网各自拥有独立的网络资源和信息服务领域,而这两大网络的用户群存在着很大的交叉。电话的使用在中国已经占有很高的普及率,传统的160/168声讯服务已经成为中国百姓所熟悉的最具代表性的电话信息服务,而Internet作为在中国刚刚兴起的信息媒体,尚需要普通百姓逐渐认识它、使用它。统一消息平台将电话网和Internet网结合在一起,极大地扩大了两大网络各自的用户群,电话用户可以用电话或者传真获取Internet上的信息,电子邮件服务也可以不局限于Internet,而能对广大的电话用户开放。统一消息平台为用户带来的是信息的方便、及时,使人们在任何时间、任何地点都能够获取需要的信息。

统一消息服务系统实现的关键是如何解决各种不同的消息表现格式间的兼容问题,从而将语音、传真、电子邮件、语音信箱/语音邮件等不同信息格式的业务有机地集成于一体。

统一消息平台体系结构

统一消息平台体系结构如图1所示。

1 统一消息平台体系结构

TTS语音网关及应用案例

TTS语音网关是炎黄新星网络科技公司研发的新一代的语音处理中间系统。其核心技术TTStext to speech)系统采用了炎黄新星与清华大学合作成立的华意语音计算研究中心的第二代文语转换技术,它支持多语言的语音合成,音速、音质及韵律均可灵活调整,合成质量贴近自然话务播音员。语音网关接收其他系统模块的文字信息,通过TTS合成对应的语音文件,然后传送到相应的系统模块。通过统一消息平台的TTS语音网关,用户就可以用电话收听Internet上的任何信息。

案例1: 中国电信168信息台

炎黄新星公司与北京168信息台合作,将最新的TTS语音技术和Internet技术应用于传统的声讯平台,初期联合开展了基于Internet电子邮件服务的统一消息服务,为统一消息服务用户提供使用语音和传真方式的电子邮件服务及相关的增值服务。在此基础上完成了统一消息服务平台的搭建,共同开发提供更丰富的基于Internet的金融信息和实用信息查询、电子商务服务、娱乐游戏服务等新的电话信息服务业务,以将Internet服务和用户群引入电话信息服务,扩大电话信息服务用户群和业务使用量。

1)技术目标

通过炎黄新星Internet语音服务系统与160/168声讯平台进行集成,使160/168系统用户具备使用传统电话进行Internet信息获取的功能。

2)技术实现

E-mail邮件收发业务为例。炎黄新星E-mail语音服务系统使用了炎黄新星统一消息平台中的两个组件产品:

E-mail网关 完成用户邮件的接收与发送功能。

语音合成网关 完成与160/168现有系统的技术接口通信,进行160/168系统与E-mail网关的协议转换,合成E-mail语音数据。160/168IVR系统可以直接播放合成的语音文件。

160/168声讯平台通过炎黄新星的网关产品与Internet相联,为了保证原有声讯系统的安全性,在炎黄新星多终端信息访问平台的网络结构中增加了防火墙设置,原有的160/168声讯平台置于防火墙的后端,只与炎黄新星的语音合成网关存在通信联系。

3)系统网络结构

系统网络结构如图2所示。

2 系统网络结构

需要解决的问题

在实际项目中我们发现,TTS语音网关作为一个产品应用于统一消息平台,为大家提供语音服务,需要解决以下几大问题:

1.语音质量

TTS的语音合成质量应该清晰、连贯,在保证用户听懂的前提下,具有一定的自然度,使听起来亲切、舒服。

2.处理速度

TTS语音网关在统一消息平台中要与其他系统通信,处理大量用户的并发请求,所以,需要设计资源分配系统进行排队及负载平衡,从而根据用户的数量方便地增加TTS处理主机,满足电信级用户收听语音的速度。

3.通信接口

TTS语音网关应能提供多种标准的通信协议接口,包括TCP/IPS.100及其他数据流格式等,方便其他系统调用语音资源。

4.语音压缩格式

TTS语音网关应能支持多种语音压缩格式,包括G.723G.726等标准的语音压缩格式,以及一些大的语音板卡厂商的专用语音格式。

5.行业应用

TTS语音网关应能根据不同行业的应用特点外挂接口,从而实现行业的语音处理定制。

6 用户的个人语音定制

TTS语音网关能为用户提供个人音库,从而能让用户在使用统一消息平台时听到自己或朋友的语音。

《计算机世界》 2001/06/04

 



相关链接:
文本-可视语音转换及其应用 2001-06-04
数据挖掘走入语音处理 2001-06-04
神经网络与汉语TTS韵律模型 2001-06-01
语音技术的拓展与展望 2001-06-01
语音门户:让网络接入更便捷 2001-05-11