首页>>CT技术培训>>应用篇- PacketMedia和IP媒体服务器>>

PacketMedia和IP媒体服务器
──新一代通信的增值业务

                   
     一.概述

     二.IP世界中的增值业务
      2.1 增值业务市场
      2.2 新一代增值业务的贡献

     三.IP媒体服务器的作用

     四.IP媒体服务器的特征和功能
      4.1 交互式语音应答(IVR)
      4.2 会议
      4.3 传真消息
      4.4 DTMF音频处理
      4.5 自动语音识别(ASR)
      4.6 文本到语音转换(TTS)
      4.7 编码转换
      4.8 媒体流化

     五.PACKETMEDIA──NMS IP媒体服务器平台
      5.1 支持要求的功能──并超出这些要求
      5.2 一个超级平台

     六.一个实质性的优势

     缩写和新词



一.概述                           

  IP的广泛使用已经导致各种多媒体通信(数据、语音、传真等)集中到单一的IP网络上来,IP网络比传统的PSTN网络更易设计、建立和维护,而且成本更低。IP媒体服务器为这个新网络提供了一个添加增强电话业务的平台。它优化了业务发布,易于扩展,并且在拥有运营级可靠性的同时具有IP互连性的优点。IP媒体服务器平台支持传统增值业务,如召开会议、传递消息和发布通知,的同时,也支持包语音──这是通信技术发展最快的一个方面。IP媒体服务器促进了新的增值业务的开发,这些增值业务正如所希望的那样,包含web驱动的环境、无线技术和移动用户的集成。

  本文讨论了OEM厂商和增值业务平台开发商在利用现成软件、硬件以及相关的开发环境来实现IP媒体服务器时,得到的好处。并详细介绍了PacketMedia,这是NMS通信在新通信网中为增值业务应用开发商提供的、犀利的、基于开放系统的总体解决方案。
                                             TOP↑

二.IP世界中的增值业务


  在这个语音和数据网整合的通信新时代,在运营商之间以及业务提供商之间,都为了争夺用户而激烈竞争。这些公司使自己有特色并赢得新用户的一个方法是:提供一个永远不断增长的增值业务阵列。IP媒体服务器为业务提供商提供了一种方法,利用包语音技术发布功能强大的、创新的增值业务──语音门户、语音浏览器和无线web接入──同时也提供传统的增值业务。

  2.1 增值业务市场

  为了获得竞争优势,业务提供商──传统长途运营和本地交换运营商,因特网业务提供商(ISP),应用业务提供商,以及无线运营商──都在想方设法发布基于IP的业务,这些业务应该:对用户有较高的价值,能缩短面市所需时间,部署是低成本高效益的。向用户提供高价值的增值业务能为业务提供商带来重要的收入源泉,并使他们更有特色,增加市场分额,特别是如果这些业务以快速、易于支持的方式部署,以上这些优势就会更加突出。据估计,到2003年增值业务设备仅在美国就能达到73亿美元的市场,正如图1所示。

图1 美国增值业务设备市场

TOP↑

  2.2 新一代增值业务的贡献

  传统PSTN增值业务平台必须和交换机一起放在中心局机房。在增值业务平台和交换机之间的连接配置起来很复杂,并且实际的中心局机房空间非常昂贵。那样部署的业务平台可以插入一个可编程交换机到整个体系结构之中来减少一些复杂性,通过这个可编程交换机进行总体控制。同时,这有助于隐藏CO交换机的复杂性,在体系结构中插入了另一层。
最新的发展是向着基于IP网络调整的新体系结构的部署。嵌入在CO交换机中的功能被分布到多个IP网络元素之中。这种分布式的体系结构被称作分解网关,它以一个分布式的结构来提供CO交换机的功能,能在一个灵活、可扩容的框架内提供传统功能的同时,得到包网络的所有好处。

  业务提供商的难题是要动态发布基于IP业务的一个选择,来仿真那些传统电话系统的业务,还要向用户提供独特的、更可靠的性能。利用IP媒体服务器把现有增值业务移植到包网络的一些例子包括:

  ■ 通讯业务

  包括一些存贮形式和消息恢复,以及在某些情况下的原始消息或广播消息。
  典型的基本PSTN语音信箱提供的是具有以下功能的语音消息:跟随有个性化的问候语、时间戳、和有密码保护的读取。但随着统一消息的引入消息会变得很复杂──不仅允许提供接入到语音消息,而且允许提供接入到电子邮件和传真。和使用语音信箱一样,电子邮件和传真也可以利用语音指令来创建和访问。消息的每一种形式都可以存贮起来,并可以根据命令发往各种不同的目的地。另外,写出来的消息也可以转换成语音并通过一部电话放给经过认证的用户听。

  ■ 预付费/支付业务

  这种业务是指利用电话输入用户和个人识别号进行认证,来管理信用帐户。
  在很多例子中,预付费业务是使用借记电话卡或预付费电话卡来实现的,它们在无线市场中非常普遍。话单/支付业务可以扩展到任何的商业关系之中。

  ■ 易于使用的特性

  象语音拨号、单键回呼、呼叫转移、呼叫等待、以及各种形式的会议和呼叫实现,都具有易于使用的特性。
  当前的很多增值业务不能得到很好的采用,都是由于它们不能提供易于使用的特性。易用性的一个例子是虚拟或电子辅助系统,它提供一个个性化的代理来轻松访问增值业务。虚拟辅助允许在任务中使用语音识别,这些任务包括:复杂的通讯,单一号码/跟随业务,呼出,目录管理,和通知业务。

  由于IP网络在迅速壮大,世界范围内网站上的信息可用性已经增长,新的增值业务在不断出现,包括:

  ■ 语音门户和语音web浏览业务

  这种业务为用户提供通过语音命令访问web内容的功能。
  语音门户目前提供基本的web内容,象股票报价、天气预告、驾驶方向、以及交通报导那样的信息,通过任一部电话利用语音命令很容易就能访问到。语音门户将会发展到提供一个广大通信业务阵列,包括:语音会议和即时语音通讯──所有都和个人计算机、PIM以及移动电话集成在一起。

  ■ 定制可控制的广告和流化媒体信息

  这种业务为用户提供可控制的或由业务提供商指定的定制内容,包括基于用户预定义文件的音乐选择、股票报价或者感兴趣的新闻故事。

  ■ IP会议

  这种业务在IP网内提供和传统功能一样的新的会议功能。
  IP会议功能使得发言人可以通过任何专用网关或IP设备进入IP网络参加在一个IP媒体服务器内召开的会议。另外,IP会议业务也将能召开其它类型的会议。一个例子是:它能召开很大型的会议,比如信息广播,收听广播的人既可以通过web接入,也可以通过PSTN接入,并且都允许收听人从任何电话或IP连接设备"呼进来"提问题。

  ■ T.38/T.37传真

  这种业务支持把基于IP的实时传真转换成电子邮件的能力。
  T.38规定了实时IP传真的标准。因此,源于PSTN的一个传真会话能够以T.38的格式进入IP网络。在IP媒体服务器中通过使用T.30,T.38和T.37,实时传真会话可以把IP媒体服务器作为终端,并把实时传真转换成T.37兼容的传真消息。然后,这个传真消息会被用来产生一个就象一个电子邮件会话的T.37传真。这使得IP媒体服务器可以提供"永不示忙"的IP传真功能。这个功能也将为统一消息应用提供基于IP的传真邮箱能力。

  IP媒体服务器提供宽阔范围的各种媒体功能──语音播放和录制,语音识别,文本到语音转换,会议以及传真──这推动着所有增值业务的实现。

三.IP媒体服务器的作用

  在下一代网络的体系结构中,信令和呼叫控制功能被从媒体处理和网关功能中分离出来。IP媒体服务器和媒体网关、信令网关、以及软交换联合在一起工作。图2说明了这些组件之间的关系。

  媒体网关把电路交换的PSTN和包交换的IP网络连接起来,完成以下基本功能:

  应用服务器和媒体网关、软交换以及媒体服务器进行通信。它可以用MGCP、H.248或SIP和这些组件通信。应用服务器的责任重大,它和媒体服务器配合比网关提供更密集的媒体功能。应用服务器通常为IP媒体功能提供处理逻辑,而媒体服务器提供媒体处理。例如,在一个信用卡呼叫应用中,应用服务器可以包含数据库信息,而媒体服务器用于提供音频提示和利用语音识别收集计费信息(帐户号、PIN等)。

  软交换完成呼叫控制和呼叫管理功能,并支持计费和管理。软交换技术为应用程序编程接口(API)提供了一个开放平台。软交换用SIGTRAN和信令网关通信,用MGCP、H.248或SIP那样的协议和其它包网络组件通信。信令网关也和其它IP设备通信。

  即使大多数业务提供商的网络包含有媒体网关,他们也需要IP媒体服务器。虽然通常的媒体网关都有强大的媒体编码/解码能力,并可以提供媒体相关的功能,如播放通知,但它不太可能记录消息或支持需要象语音识别那样功能的媒体密集应用。这些功能在IP媒体服务器上实现会更理想,这样做还可以保持媒体网关简单、可靠、低价格高性能的特点。

 TOP↑

四.IP媒体服务器的特征和功能

  一个专用的IP媒体服务器符合运营商和交换机制造商的需要,它的设计集中于单一目标──在各种增值业务应用所需的IP环境中支持媒体功能。为了满足增值业务开发商的需求,IP媒体服务器必须提供:

  一个媒体服务器可以随意设计成同时向IP和PSTN端点提供服务。这样的一个服务器的关键是密集媒体处理,附带灵活地接受基于PSTN或基于包的输入和输出。
  开发商要求大范围的媒体支持,并期望这些功能随着时间的过去将会得到扩展。以下是在一个IP媒体服务器中需要的核心媒体能力:

  4.1 交互式语音应答(IVR)

  交互式语音应答和语音消息传递功能对一个媒体服务器的运行很关键。以下功能是提供IVR和消息传递服务所必需的:

  利用这些功能,可以开发出象统一消息、电话银行、呼叫中心、以及信用卡呼叫那样的应用。用嵌入式DSP来实现语音播放和录制、以及DTMF处理,能够得到高密度的应用平台,易于应用开发,还能提供高运行效率以及方便维护。把录音功能的集成和DTMF、语音识别事件紧密结合起来,能够简化应用的开发,并能对用户的输入作出快速的响应。在一个IP媒体服务器中对IVR和消息传递功能的需求,和在一个基于PSTN的增值业务平台的需求几乎是一样的。但IP媒体服务器还支持额外的语音编码格式,这种编码只有IP环境才用到(流化音频,G.723.1,以及其它)。

 TOP↑

  4.2 会议

  众多的增值业务需要会议功能,范围包括从基本的会议召开到监示和日志应用。

  4.2.1 基本的会议需求

  在PSTN中,会议的召开要求每个与会成员都接续到一个会议桥,一个通常的PSTN会议桥包括以下功能:

  4.2.2 附加的IP会议需求

  在一个IP环境中,会议功能必须能够支持所有在传统PSTN环境可用的混合特性,通过支持编码语音的实时协议(RTP)使用输入输出数据流。下面附加的能力和需求也必须加以考虑:

 TOP↑

  4.3 传真消息

  在一个IP环境发传真,为大量节省成本和增加功能提供潜力。因此,一个IP媒体服务器的重要需求是提供灵活的传真处理功能。需要支持以下的传真标准,来提供能处理所有潜在传真消息类型的健壮特征集。

  ● T.30传真

  T.30定义了通过PSTN收发传真的框架结构。为了能接收传真文档或发送TIFF-F文件,必须使用T.30兼容的传真功能产生或终结传真信号。传统上,呼入传真信号直接来自通过PSTN连接起来的另一台传真机,但是,将来这些传真信号也可能是解码T.38传真消息的结果。

  ● T.37传真

  T.37是基于存贮转发的传真标准,它定义了怎样才能象发电子邮件那样发传真。T.37为把传真发到简单邮件传送协议(SNMP)指定了一个多目的因特网邮件扩展(MIME),允许把传真形成一个传真文件,作为电子邮件的附件来发送。T.37标准允许通过"入站"网关把传真文件从PSTN发送到IP网络,通过"出站"网关从IP网络发送到PSTN。

  ● T.38传真

  T.38标准为通过一个IP网络实时传送传真提供框架。T.38标准是一个基于分段传送的协议,协议中呼入传真信号首先被传送网关解调成T.30二进制数据,再转换成T.38消息并通过IP网发送出去。然后,由接收网关或媒体服务器把T.38消息转换回T.30二进制数据,这些二进制数据再被调制回到传真信号。T.38标准还相当新,但已经被基于IP的运营商广泛接受。

  为了涵盖各种不同情况,根据传真的源和目的地,IP媒体服务器必须支持广大范围的传真能力。另外,开发商必须决定如何存贮传真消息──作为一个TIFF文件,作为编码IP消息,或以其它一些格式。举例来说,在图3中,媒体网关接收到一个发自A的传真,它要用T.38协议经一定的路由发到目的B。但是,由于B正忙,T.38传真被软交换重定向到IP媒体服务器C,在那里传真被一个T.38接收进程接收。然后,一个具有T.30能力的传真功能接过从接收T.38传真进程产生的输出,并把传真文件转换成一个TIFF-S文件用于存贮和后来的取回(读出)。用户以一个T.37兼容的电子邮件方式接收到这个传真(D)。

  我们的目标是让IP媒体服务器能够处理所有可能的源和目的传真协议。另一个有意思的传真消息能力可能是在一个语音信箱中提供语音通知,以及为应用从传真中智能地摘取出一些标题或目录信息,利用TTS技术把这些信息包含在通知里面。

 TOP↑

  4.4 DTMF音频处理

  从理论上说,随着IP技术的广泛使用,本来没有必要再使用DTMF。但是,在混合了包交换和电路交换的网络中,可能还是需要对DTMF音频做处理。虽然DTMF在PSTN一侧使用广泛,但是在IP/PSTN网关中,它通常不是被压制,就是被滤除。如果DTMF被网关滤除,然后用一个带内或带外的消息来传递它,IP媒体服务器处理这个信号,并把它和被控制的行为相匹配,例如,播放一个提示或提供一个菜单选择。如果DTMF没有被网关滤除,那么IP媒体服务器就必须设计成能够检测出这个信号,并据此做出相应的动作。

图3 传真通讯应用

 TOP↑

  4.5 自动语音识别(ASR)

  自动语音识别是语音驱动增值业务的关键,它使得呼叫者能使用语音命令来操控业务。优质语音识别的可用性正在不断加强,推动着语音驱动应用的广泛采用。IP媒体服务器必须收集实现全套语音驱动特征所需的所有功能。

  语音识别的一个主要需求是提供高质量的语音,以将语音识别组件的错误减到最少。回声和噪声必须从信号中滤除,以优化语音质量。例如,无线是一个特别吵杂的环境,IP媒体服务器必须使用能在这个环境很好工作的语音识别引擎。另一个例子是打断应用,这个应用要求很有效的语音功能检测和静音检测,以确保背景噪声没有错误触发识别器并中断消息或用户提示的递送。

  另一个ASR需求是语音引擎是基于主机的,因为基于主机比基于DSP的方案更有效和有更低的成本效益比。另外,必须使用短暂的缓冲,让信息尽可能快地通过语音识别器,让识别器提供出近乎即时的识别。对于大规模、可升级的语音识别应用,为了支持象Nuance通信(www.nuance.com) 和SpeechWorks(www.speechworks.com)那样的领先供应商提供的设备,IP媒体服务器必须优化缓冲和语音处理能力。

  利用同时放音/录音为ASR提供打断功能

  当和打断相结合时,同时放音/录音使得语音识别引擎在同时播放一个提示或其它语音流的同时,能够侦测到由呼叫者发出的一个中断信号。对大部分的语音应用来说这是一个重要的特性,特别是对web浏览和电子邮件阅读,一旦用户已听到他们需要的信息,比如菜单选择中的某项,他们通常想马上中止听余下的内容,而转移到下一个内容。没有对打断的支持,用户就必须听完全部的提示,这就增加了让用户失望的可能性。有效的打断很象一个全双工的电话交谈,交谈中在听的人能够在说话的人把话说到一半的时候打断他。而同时放音/录音提供了一个更有效的办法,更能让用户满意,它能够显著地增加系统的载荷能力,因为它要求使用缓冲来持续传递语音到主机语音识别引擎。

 TOP↑

  4.6 文本到语音转换(TTS)

  对想收听电子邮件或其它定制信息的移动工作者来说,文本到语音的转换是一种越来越吸引人的应用。在语音应用中,TTS引擎通常是基于主机处理器的。除了要支持领先TTS引擎和提供接过TTS输出,并利用对应编码标准通过一个IP流重定向这个输出的能力,也许再也没有特别的要求了。对于实时应用,IP媒体服务器会流化进入的媒体,通过IP网络送出去,同时侦听其中的命令,例如,为了中断一个正在阅读的很长电子邮件。对于非实时应用,IP媒体服务器可以利用TTS把数据转换成一个语音文件,然后象数据一样通过网络来传递,重新装配,最后由一个接收器/播放器回放出来。

 TOP↑

  4.7 编码转换

  因为有各种不同的语音编码标准在使用,所以一些编码转换功能必须集成不同的声码器(语音编码器)标准,并允许呼叫无缝地穿越IP网络。单一的语音编码标准也许永远不可能,因为通过吵杂的空中接口支持移动无线用户的声码器需求,不同于通过包网络提供高质量音频的声码器需求。编码转换也可能继续作为支持会议功能的一个重要需求,因为会议系统要求能够处理使用不同编码标准的混合发言。在一个IP媒体服务器上实现这个功能既低成本效益比,又具有极高的可靠性。

 TOP↑

  4.8 编码转换

  应用的数量在不断增长,尤其是语音门户,为用户提供访问产品质量和预先记录内容的能力,比如来自主要新闻机构的新闻供给、音乐、叮当声、或其它音效。音频内容用于增强用户和应用程序的交互。在某些情况下,这个音频内容可以被简单流化成一个文件,然后在客户端设备上回放出来。在另一些情况下,需要IP媒体服务器把音频内容合并成一个与用户的对话,也可能合并成其它媒体处理能力,比如通讯、语音识别、或者会议。IP媒体服务器也许必须执行一个编码转换功能,把音频从一种编码格式转换成另一种。

  有多种音频内容可用的编码格式,比如Real Networks的RealAuto和MP3(MPEG第三层)。这些编码格式广泛应用于流化给基于PC的客户端的内容。


 



                                             TOP↑


page1 ││ page2