首页>>>技术>>>VoIP

P2P VoIP应用的性能评测

杨永铭 王喆 2008/09/24

  摘要:基于IP技术的语音分组传输(VoIP)电话目前被广泛使用,Skype与GTalk是VoIP应用的两个典型代表。在可控网络环境下,通过调整信道容量、时延、丢包、抖动等网络参数,利用PESQ MOS方法评测了Skype与GTalk的语音质量,并且讨论了在可变网络环境下的动态适应性策略。

1、引言

  VoIP是将模拟语音信号通过压缩编码处理变成语音数据流,然后按TCP/IP标准打包,再通过IP网络传输,在接收端通过解压缩编码还原成模拟语音信号,完成整个通话过程[1]。由于IP网络无业务质量保障,会带来一定的语音包时延和丢失,影响语音质量,语音质量问题是影响VoIP发展的重要因素。

2、P2P VoIP的应用

  Skype与GTalk使用的是UDP/TCP传输协议,使用相同的编解码器。Skype与GTalk继承了P2P网络的一些特性,如各节点间合作且共享网络资源。Skype采用全球搜索目录(GI)技术,GI是一种可扩展网络技术,它使用多层的网络结构,利用超节点来实现网络中的每个节点可以获取所有其他可利用节点的资源,并将这些节点资源动态组合,来参与流量分配、路径选择、处理需要较大带宽的任务等,并保证最小的时延。GTalk采用IETF制定的XMPP协议,可提供与其他VoIP应用的免费连接,GTalk网络可以与其他VoIP网络协同工作。

  有关VoIP应用的研究工作现在正在不断取得进展。参考文献[2]中评估了在GPRS网络中VoIP的性能及业务质量。Furuya评测了VoIP的服务质量与网络参数(容量与时延)的关系[3]。Baset S A和Schulzrinne H是Skype最早的研究者并初步分析了Skype的一些相关的技术[4],后来Guha等通过具体的实验重点研究了Skype中的超节点,为研究VoIP的流量模型奠定了基础[5]。

3、评测方法

  本文的工作是分析和比较Skype与GTalk在网络环境状况发生变化时,它们的语音质量及其服务质量,这里所说的服务质量是指对于网络状况发生变化的适应能力。本文通过两种方法来进行研究。一是通过分析网络传送数据包的有效负载,以及所使用的编解码规则和相关的参数信息,基于这些信息可以推断它们的语音质量和服务质量[3]。另一种方法是通过一个评测模型来评估音质量的优劣,如E-model,它可以客观地评价语音质量但是需要利用各种网络参数来评定语音质情况。需要注意的是Skype使用专有的协议,并且采用了加密机制,这就阻止了对网络传送的数据包的分析,也就不能准确地分析出它的语音质量和服务质量。基于以上研究可以把VoIP网络看作是一个黑盒子,在两端对网络参数进行测试,来评估Skype与GTalk语音质量。

  3.1 实验环境

  本文所建立的实验系统如图1所示。主机S与主机R分别是发送端与接收端,负责语音信号的发送与接收。音频记录软件使用Audacity。NAT-R与NAT-S是两个NAT-Boxes,主机S和R通过它们与外界网络进行连接。Network Emulator(网络仿真器)使用的是NIST.Net,完成各种网络情景的再现,CD播放器重复地产生一个长达1 h的采样音频,这些音频数据通过网络仿真器传到R。

图1 实验系统框架

  3.2 网络的度量衡量标准

  实验中需要评测的性能参数有:语音质量和从S到R的数据传输率(它是Skype与GTalk适应性能的直接表现)。对于传输数据流的分析工具是tcpstat。

  语音质量的测评方法有几种:一种是MOS(平均主观值法)[6],这是由ITU-T制定的一个较为主观的评价方法,由直接参与到语音通信中的人来评定语音的质量,语音质量最终被评为1~5分,分数越高语音质量越好。与MOS相比,E-model[7]是一种较为客观的评估语音质量的方法,关注影响语音质量的全面的网络损伤因素(如时延、抖动、回音、编解码等)。由于不能获得有关Skype与GTalk编解码器的信息,所以就无法采用此方法来评测语音质量。实验中所采用的是PESQ(感知评估通话质量测评)[8],此方法实际上是通过复杂信号处理,用PESQ算法对发送信号和接收信号进行校准,然后评估这两个信号间的差异,最终评测结果对应于MOS。

  3.3 实验描述

  在一个可控的网络状态下,对Skype和GTalk进行评测。本文建立了4个具体的实验,在这些实验中以下几个参数分别出现:信道容量、时延、丢包率和抖动,这些参数值的选取是针对Skype与GTalk来具体确定[9]。
  
  实验过程中,网络参数会被定义为几个不同的值,在语音传输过程中,这些值是动态变化的,在变化的每个阶段,发送端会发送1 h的语音信号,接收端收到的是60个1 min的语音信号。实验对Skype与GTalk是在相同状况下重复进行,Skype的版本为2.0.0.81,GTalk的版本为1.0.0.92。

4、性能评测

  4.1 信道容量影响

  在此实验中,设定时延25 ms且没有明显的丢包和抖动。要研究的是当信道容量逐渐变化(50 kbit/s、40 kbit/s、30 kbit/s、20 kbit/s、15 kbit/s)时,Skype与GTalk相应的变化。通过观察传输率(见图2)和PESQ MOS(见图3),发现在信道容量为50 kbit/s时GTalk利用了更多的带宽,传输速率比Skype更高。当信道容量变为40 kbit/s时,GTalk发生了很明显的变化,传输速率降低到了35 kbit/s。这个变化使得其PESQ MOS分数与Skype相比有所提高,而Skype的传输速率则接近信道容量。当信道容量变为30 kbit/s时,两者间差异不大。当信道容量为20 kbit/s时,Skype首次优于Gtalk,当信道容量为15 kbit/s时,Skype的PESQ MOS分数比GTalk高5.5%。通过观察知道,在容量为20 kbit/s时两者的传输率相同,但PESQ MOS分数却不一致,合理的解释就是GTalk出现了很严重的网络抖动情况(如图4所示)。

图2 吞吐量随信道容量变化状况

图3 PESQ MOS随信道容量变化状况

图4 平均抖动随信道容量变化状况

  4.2 时延影响

  网络参数设置为信道容量50 kbit/s且没有丢包和抖动发生。确定几个等级范围,其中时延为1 ms、10 ms、100 ms时通话是可以接受的,时延为500 ms、1 000 ms时语音质量就变得不可接受。对于Skype,时延对其服务质量的影响更为明显,如图5所示,传输率从37.5 kbit/s降为19.36 kbit/s。然而,对于GTalk其传输率则没有明显变化。由图6可知,在时延为1 ms、10 ms、100 ms时Skype的PESQ MOS高于GTalk,在时延为500 ms、1 000 ms时GTalk则略优于Skype。

图5 不同时延下吞吐量的变化状况

图6 PESQ MOS随时延的变化状况

  4.3 丢包影响

  设置信道容量为50 kbit/s,时延为25 ms,没有抖动,丢包率分别定为0、1%、5%、10%、30%、40%。如图7所示,GTalk对于丢包发生,没有适应性机制。可以设想Skype对数据流增加了冗余信息来减少丢包对语音质量的影响,这就解释了在丢包率为1%、5%、10%时传输率的增长。然而,Skype的这些适应机制并没有使得PESQ MOS分数比GTalk高,如图8所示。在丢包率为5%时,Skype添加了过多的冗余,消耗了过多的网络带宽,而PESQ MOS并没有期待中的提高。

图7 不同丢包率下的吞吐量的变化状况

图8 不同丢包率下的PESQ MOS变化状况

  4.4 抖动影响

  设置信道容量为50 kbit/s,没有丢包,时延为100 ms,抖动为0 ms、20 ms、40 ms、60 ms、80 ms。但是测量数据没有显示出任何适应性的迹象。在本实验中抖动只是改变了接收端的缓冲区大小,对数据流传送没有任何影响,并且实验结果也显示PESQ MOS或者说语音质量与抖动没直接关系,具体的实验图示不再赘述。

  4.5 实验分析

  虽然实验比较了VoIP的两个应用GTalk与Skype,但目的不是要分出它们的优劣,而是要找出普遍存在问题,给VoIP的应用开发商提出建议。

  采用不同的编解码方式,其对应的业务质量可能不同。即使是使用相同的编解码方式,也可能会表现出不同的语音质量。对于VoIP的应用来说,具有高效的适应机制来适应复杂可变的网络环境相当重要,适应性好的应用会更有优势,例如,当带宽有限时,GTalk始终保持一个较高的传输率,从而产生了严重的抖动和PESQ MOS分数的下降。另一方面,Skype在有较高时,传输率有明显的下降,导致业务质量更糟。

  数据流中添加冗余信息可能会产生好的效果,如图7、8所示,当丢包率小于10%时,Skype可以使PESQ MOS的分数保持在3分之上,GTalk没有采用适应性机制,从而其语音质量随着丢包率而线性下降。但是,也需要对添加冗余信息的量度有一个把握,否则会产生不好的效果,因此还需要进一步地提出更有效的冗余设计方案来适应可变网络。

5、结束语

  本实验比较了P2P VoIP的两个应用Skype和Gtalk,讨论了它们在网络状况变化时的动态适应策略,并且通过PESQ MOS方法评估了它们语音质量的优劣。通过实验可知:在理想的网络状况下,Skype表现得更好一些(两者PESQ MOS的分数差别为0.1),总体而言它们的语音质量还是较为接近。在网络有较长的时延时,Skype有不必要的适应性。当丢包情况发生时,GTalk没有实施任何机制来提高其性能,与此同时,Skype使用数据冗余机制来对抗丢包以提高其语音质量。在抖动情况发生时,两者都没有很好的机制来提高其适应性。当有较长的时延时,PESQ MOS并不是最佳的评估语音质量的方法。所以,尽管实验中包含有时延对语音质量的影响结果,但这可能不是十分准确,有待于进一步研究。另外,以上的实验是Skype与GTalk分别进行,之间没有相互影响,若是VoIP的具体应用需要竞争相同的网络资源时,它们的表现情况如何研究者需要进一步的研究。

参考文献

  1 朱海毅,周春楠.VoIP基本原理.信息技术.2003,5(5)

  2 Shen Q.Performance of VoIP over GPRS.In:17th International Conference.on Advanced Information Networking and Applications(AINA’03),2003

  3 Furuya H,Nomoto S,Yamada H.Experimental investigation of the relationship between IP network performances and speech quality of VoIP.In:10th International Conference on Telecommunications(ICT 2003),March 2003

  4 Salman A B,Henning S.An analysis of the peer-to-peer Internet telephony protocol.In:IEEE INFOCOM 2006,April 2006

  5 Guha S,Daswani N,Jain R.An experimental study of the skype peer-to-peer VoIP system.In:5th Workshop on Peer-to-Peer Systems(IPTPS),February 2006

  6 International Telecommunications Union.Methods for subjective determination of transmission quality. Recommendation P.800,August 1996

  7 International Telecommunications Union.The E-model,a computational model for use in transmission planning. Recommendation G.107,1998

  8 吴耀文,王平.VoIP语音评价方法综述.舰船电子工程,2006(1)

  9 Miras D.A survey on network QoS needs of advanced Internet applications. Internet QoS Working Group,2002

电信科学



相关链接:
企业Skype暴露内网隐私 2008-09-24
创造性地满足本地客户的需求─访Avaya中国区总经理 2008-09-23
Spirent辛小秋:VOIP方面的测试方法和经验 2008-09-19
大唐高鸿张新中:构建安全高效融合通信系统 2008-09-19
高清 会议 网络增值成IP电话突破口 2008-09-18

分类信息: