您当前的位置是:  首页 > 资讯 > 国内 >
 首页 > 资讯 > 国内 >

SIP协议及新IP企业通信网络技术概论-影响QoS十大因素和语音质量量化指标

--MOS/R-Factor以及各种编码使用研究分享

2022-01-19 10:47:43   作者:james.zhu    来源:Asterisk开源派   评论:0  点击:


  在最新的IP企业通信中,服务提供商根据市场需求为客户提供了各种网络架构和部署方式。企业客户根据企业业务自身的需求,一些企业使用软硬件本地部署方式,一些企业则使用纯软件的部署方式。无论采用何种方式部署或者何种所谓的新技术,最终客户是根据效果来买单的。通话语音质量是服务效果中最重要的一个指标。如果语音质量或者通话质量有问题,其他的架构和价格都无任何价值。无论是运营商还是集成商,在对客户提供服务来说,语音质量保障(QoS)是一个关键指标。不幸的是,QoS保障涉及了语音替换的整个处理流程中,涉及了终端,服务器端,呼叫路由策略,呼叫网络环境(抖动延迟等),编码/采样打包等细节。在处理这些问题时,终端用户往往无非常有效的手段来评测语音结果。今天,笔者就 语音网络所涉及的一些关键要素做深入讨论,并且结合历史文档做回顾分享,vqmon工具简单介绍,最后针对一些关于语音编码的测试和诺基亚研究院的编码测试评价标准和网络突发丢包状态下不同编码的MOS表现做一些分享。
  1关于语音编码以及相关十大要素的讨论
  如果读者想了解QoS保障的整体知识架构,笔者认为读者应该首先对整体网络环境的技术框架,和基本相关的细节有比较深入的了解。这些涵盖的知识点包括,基本的VoIP基础常识,RTP传输路径,各种编码和采样率特性(包括比较早的带编码和最近的宽带编码),SIP/SDP基础,关于RTP封装和RTCP的基础,语音质量的评价标准的量化技术手段-MOS/R-Factor,影响QOS的十大相关因素。除了以上知识点,另外,读者也需要了解针对某些特殊行业或者敏感行业对语音安全的加密要求。美国安全部门发布了assured SIP services(As-SIP)非规范的草案,针对语音加密提出来专门的架构要求。在笔者的历史文章中,笔者针对以上专题都做了非常深入和全面的讨论,笔者认为没必要再重新发明轮子,重复介绍同样的内容,读者可以参考一下链接学习:
  2vqmon 工具和RTCP XR支持
  虽然前面笔者花费了大量的章节讨论了关于QoS和MoS/R-Factor等语音质量评价标准。但是,在实际IP语音方案的部署中,绝大部分的用户仍然缺乏统一的规范的语音质量评价标准来评价其语音质量。大部分的用户仍然靠耳朵听来体验其语音质量,无标准的量化输出结果和工具。虽然一些终端为了实现维护的便捷性也支持了MOS和R-Factor包括RCTP-XR,但是,服务器端或者其他的IPPBX不能支持,因此实现全流程的语音质量标准检测仍然是一个问题。这里,笔者认为无论是用户还是服务提供商可能缺乏对语音量化指标使用认识。他们可能认为语音质量评价或者MOS/RCTP-XR基本上都属于维护性工具,对用户来说可能不是一个刚性需求。对用户端来说,如果个体终端出现语音质量问题的话,一般排查手段是通过抓包方式对每个特定终端检查数据是否正常。对集成商来说,管理界面可能就配置了几个常用的debug排查工具来排查问题,缺乏自动化的智能上报工具。但是,这些用户基本上都忽略了基本事实,目前很多部署场景都是基于互联网环境异地部署,大批量终端部署在不同的网络环境中的特点。在这样的复杂网络环境中,终端如果对服务器端不能定期上报语音质量统计数据,而且服务器端也没有支持对终端数据的实时采集,那么对系统的运营管理将是一个极大的挑战。
  在一个通话过程中,可能有多种原因会引起语音通话的质量的变化,包括噪音,语音失真,音量或者增益过高或者过低,回音,语音间断,软硬件故障等各种问题。如果进一步细化语音质量的话,可能又分解为接听语音质量,通话中的语音质量和传输质量等。国际电信联盟又进一步将这些语音质量分类细化为:
  • MOS-AVQE :语音图形化质量;
  • MOS-CQE :预估通话语音质量;
  • MOS-LQE :听到的语音质量;
  • MOS-TQE:谈话语音质量;
  • MOS-VQE :可描绘视频质量;
  以下评价表是来自于RFC3611的关于RTCP XR评价的具体参数,用户可以阅读RFC3611-4.7 章节关于 VoIP Metrics Report Block说明。
  
  资料来源:RFC3611
  目前,VQmon(Voice Quality Monitoring (VQMon)是一个非常专业的解决方案,它提供了针对MOS的完整支持,通过可感知的算法,支持了多种国际规范,包括ITU-T P.564, ITU-T G.107, ITU-T G.1020, ETSI TS 101 329-5 Annex E 和IETF RFC 3611等。它通过软件API方式可以支持各种终端实现专业的MoS统计。著名的CounterPath 软电话eyeBeam 就实现了VQmon的支持,Polycom的终端也支持了VQmon功能支持RTCP XR数据包的发送。VQmon可以软件或者芯片方式支持SIP终端,网关,SIP服务器/IPPBX和网关SBC设备。通过VQmon支持,用户管理平台可以非常轻松获得全部设备终端的RTCP XR专业报告。
 
  此图例以及以下部分图例均来自于互联网资源
  除了以上商业解决方案以外,目前很多的终端支持了RTCP-XR,例如polycom,Snom,yealink和Cisco等厂家的产品。针对服务器端管理平台,HOMER(HEP)是比较完整的开源平台,它可以支持其他的开源媒体服务器和SIP软交换,实现比较完整的语音质量管理。
  3语音编码研究成果分享
  虽然目前市场上针对语音质量评价和MOS已经国际电信联盟的标准和相关的官方,但是关于MOS的评价,以及各种窄带和宽带语音编码的研究一直没有停止。笔者在此章节和大家分享一些关于语音编码研究的成果,希望通过市场产品结合学术领域的研究为读者创建一个比较完整的关于语音编码质量以及MOS的知识架构。
  在过去的一个世纪,人类的通信基本上依赖窄带的语音进行通信。其窄带语音质量基本上满足了人类进行正常语音沟通的要求。随着科技的不断发展,例如人工智能,语音识别和物联网的兴起,窄带语音已经不能完全满足其应用需求。目前市场上已经出现了窄带语音,宽带语音, 超宽带语音和全宽带语音的应用要求。在传统的语音通信中,我们使用G.711已经可以满足语音通信的要求,而且MOS值最高到4.3。但是,随着各种语音服务的不断增加,运营商使用宽带语音来进行语音传输,例如G.722 等。宽带,甚至于超宽带语音可以支持更自然的语音,同时提供了语音的清晰度,和语音质量。特别是针对语音发音中的一些辅音字母,例如S,或者F,我们使用G.711编码是很难听到字母辅音的,但是,如果我们使用宽带语音编码,例如G.722就可以听到。所以,宽带语音支持了更好的语音清晰度。
  
  一些音乐产品,例如CD等,为了保证其音乐声音更加圆润饱满,也需要使用宽带编码来处理。如果为了能够适应各种人类年龄段的听觉的敏感度,可能需要使用全宽带语音来获得更好支持。显然,根据以上讨论,我们知道语音质量MOS的评价最高设置为4.3。如果使用了更多高清语音编码以后,MOS评价值设置为4.3显然不能算是一个非常合理的评价。诺基亚研究院建议MOS评价值从4.3提高到9。诺基亚研究院使用诺基亚听力检测设备对窄带,宽带,超宽带的编码,单声道语音和立体声语音进行了不同的对比试验,通过调整其MOS和速率来检测其最终测试结果,具体的试验检测场景如下:
  
  
  
  通过研究人员发布的论文结果可以看出,使用超级宽带编码可以取得比较大的语音质量提升。
  我们都知道,IP语音通信系统是处于动态网络环境中。呼叫路径上的任何一个节点或者网元发生故障或者其他不稳定问题都会影响语音质量和MOS值。一些任意的和突发的网络丢包会严重影响语音质量。在不同环境不同终端使用了不同编码情况下,或者在遇到网络突发的丢包时,不同编码会产生不同的语音质量评价值(MOS)。研究人员Gaous Afrizal针对不同突发网络问题带来的网络丢包,针对G.711,G.722, G.729, AMR-NB和AMR-WB做了对比分析。以下测试结果(RFC3551)包括任意网络丢包环境中的AMR编码和G729等编码的MOS统计结果:
  在突发丢包测试中,初期N=2时,G.711的MOS值必须仍然很好。
 
  但是,随着N的变化,其他编码的表现开始逐渐优于G.711 编码。当N=4或者N=5时,G.722-64 编码的MOS值表现最好。
  
  
  通过以上论文结果,我们可以看出宽带编码在当前的网络环境中,和其他窄带编码相比具有非常好的网络适应能力,可以保证更优质的语音质量和相对比较高的MOS值。随着宽带语音编码(HD voice)的不断普及,越来越多的应用场景开始使用宽带编码支持的语音实现会议功能,云融合通信等应用。
  
  4总结
  语音质量一直是SIP网络推广过程中用户比较关心的问题。笔者通过针对语音质量评价MOS的讨论,为读者提供了可量化的评价指标详细说明。一些QoS语音质量保证需要依赖于各种节点的控制和管理,读者通过历史章节中关于QoS三个章节详细说明了其具体的细节。虽然QoS保证可以通过多种方式来实现,但是最终评价语音质量还是需要依赖MOS评价指标来检测。在当前的网络环境中,窄带编码,宽带编码,超宽带编码以及全宽带编码已经出现在了具体的应用场景中。网络管理平台需要采集各种节点,终端和网关的RTCP-XR,VQmon是一个非常好的工具,它可以灵活支持各种SIP终端,网关等设备。诺基亚研究院通过MOS值调整,对各种语音做了充分的对比分析,值得读者参考此结果做更深入分析。另外,针对网络不稳定环境中,语音编码和MOS的相关性也是非常重要的。通过Gaous Afrizal研究论文,我们了解了在不同突发丢包环境中,G.722的MOS表现非常稳定,优于其他的语音编码。因此,未来语音通信中,宽带编码将占据主流的位置,更多终端,服务器端将支持宽带编码。
  参考资料:
  • https://tools.ietf.org/id/draft-ietf-sipping-rtcp-summary-07.html
  • https://datatracker.ietf.org/doc/html/rfc3611#section-4.7
  • www.asterisk.org.cn
  • www.dinstar.cn
  • https://opensips.org/pub/events/2016-05-10_OpenSIPS-Summit_Amsterdam/Alexandr_Dubovikov-OpenSIPS_Summit2016-SIPCAPTURE_Troubleshooting.pdf
  • https://www.voicehost.co.uk/help/call-quality-r-factor-and-mos
  • Anssi R?m?,Nokia Research Center,VOICE QUALITY EVALUATION OF VARIOUS CODECS
  • Gaous Afrizal, Impact of Random and Burst Packet Loss on Voice
  • Codec G.711, G.722, G.729, AMR-NB, AMR-WB
  • https://datatracker.ietf.org/doc/html/rfc3551
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业