首页>>厂商>>语音板卡开发商>>东进技术

语音合成基于DSP
——东进基于DSP的TTS语音卡

2001/08/30


  在各种 CTI应用系统中,电脑语音板卡是一块基石,板卡性能是否稳定、单机板功能集成高低且采用微处理器与否,直接影响到整个应用系统的稳定性。DSP是近年来广泛应用于通信行业的新技术,自DSP技术应用到电脑语音板卡后,大大增强了板卡的功能,也为集成新技术和新功能奠定了基础。

  TTS作为CTI的一项核心技术,就是利用DSP技术集成到语音卡上的。

  在目前的CTI应用中,自动语音应答系统的放音大多采用录音——简单拼接——重放的方法。

  而中文语音合成技术(TTS),是基于语音数据库技术,采用语音基元拼接的方法进行语音合成。采用这种技术的汉语文语转换系统,通过隐马可夫模型法等算法进行文本分析,依据汉语韵律的变化建立多样本的语音基元数据库,并采用恰当技术挑选所需语音单元拼接起来,生成高自然度的语句。由于语音基元样本截取于自然语音波形,所以合成的语音具有高清晰度和高自然度。而且只要语音数据库足够完备,就可以拼接出任何语句。

  TTS技术的应用在CTI环境下的特殊技术要求包括:

  ◆并发处理能力要求高。CTI是并发、随机的业务,要求能够同时处理多个呼叫请求,因此要求同时多通道TTS放音,支持高密度应用。

  ◆实时通信处理。电话通信是实时通信,要求TTS的时延控制在很小的范围内(低于0.1秒),否则可能造成接续不够连贯。

  ◆开放性环境是大势所趋。通信业务在逐步开放,TTS需要具备二次开发接口性能才可以集成在CTI、智能网等业务中。

  ◆灵活扩展性。随着业务规模扩展,TTS 能够随着CTI系统扩容而灵活扩展,最大限度保护既有投资。

  ◆版本方便升级。当TTS产品的技术性能得到进一步提升时,在不增加任何硬件的情况下可以通过软件更新实现版本的升级。

  为满足这些要求,很多供应商提出了技术方案,语音卡供应商Dialogic和深圳东进分别提出了自己的解决方案——基于DSP技术的TTS语音卡。

  基于DSP的TTS语音卡解决方案充分考虑通信网环境,特别是电话通信的环境,很好满足了CTI系统的技术需求。

  东进(http://www.dj.com.cn)的解决方案是在一块语音板卡同时集成32线TTS合成和16线电话呼叫处理能力。其D160A-TTS语音卡,采用DSP芯片、内置TTS技术、内置32方会议、单卡提供16通道的电话语音处理功能的模拟语音卡,在卡内程序中嵌入了TTS 系统的接口,支持中文WindowsNT平台和中文语音合成。

  下面以深圳东进的D160A-TTS产品为例简单介绍TTS语音卡的应用。在数字中继线路上(ISDN-PRI信令,1号信令,7号信令)的硬件构成如右图。

  TTS方面的操作是在D160A-TTS的DSP基础上实现的,而通过E1线路和电信网络接口的处理、信令处理、交换、接续控制等,都是由D320/640 E1实现的,调用的是数字中继卡的API函数。

  单独的一块D160A-TTS卡上面除了支持TTS的功能之外,还可以处理呼叫控制、信号产生、DTMF收发、电话会议、A/D转换、D/A转换等。

  D160A-TTS数字中继线路上的硬件构成图

  从软件结构上面来看,基于DSP的TTS技术具有模块化、开放性、可升级性等特点。软件模块的组成如下:

  TTS API(TTS编程接口)是面向开发商提供的接口,对于没有TTS技术背景的开发人员来说,使用TTS API也可以开发出完整的TTS程序。

  D160A-TTS软件模块组成图

  TTS语音卡在CTI系统中应用非常广泛,在银行、政府机关、气象服务中心、考试中心、公用事业、114查询台、160/168信息台等的IVR交互式语音应答系统中都可采用,甚至用在网络中,用户可以通过普通电话拨入Internet,利用TTS技术收听网页和E-Mail。

中国计算机报 2001/08/30



相关链接:
东进技术总裁贺建楠谈3G应用落地:进展超出预期 2009-09-25
东进技术喜获“2009年度优秀通信企业” 2009-09-23
东进技术推出新一代数字交叉链接设备 2009-09-15
东进技术助力江苏昆山城管实现数字化 2009-09-02
当呼叫中心遇到ERP 东进技术助力河北百度 2009-08-26