首页>>>技术>>>视像通信  视像通信产品

看不清的高清

吴锦 2006/09/22

  随着人们认识的深入以及网络带宽环境的完善,视频会议系统市场正呈现出平稳增长的态势。不过,在这个由技术驱动的市场中,总是不缺乏新的概念与产品,高清视频会议系统的出现及热炒,无疑为视频会议市场带来诸多变数。但随之而来的问题是,什么样的系统达到高清的标准?高清是否真正成熟?它能为用户带来多大的助益?用户又该如何规划并挑选合适的视频会议系统,并最终让其发挥异地协作和多方面交流的优势?

  剖开产品宣传的华丽外衣,可以发现大多数厂商的高清视频会议系统离真正的“高清”还有较远的距离,它们的音视频传输质量只是比传统视频会议系统有所提高而已。

  9月初,北京京都信苑饭店,一场关于高清视频会议系统的论坛在这里举行。这本是由视频会议系统厂商举办的一次产业论坛,也邀请了一些行业专家参与。通常,在类似的论坛中,专家与厂商大都是同一声调,共同描绘技术及市场前景。但此次论坛却出现了一些戏剧性的场面,以清华电子工程系何芸副教授为首的专家与主办论坛的厂商展开了面红耳赤的争辩:在1Mbps的带宽下,能否实现高清晰视频通信?

  何芸副教授是IEEE电路与系统协会的图像信号处理和通信技术委员会委员、图像编码会议(PCS)实行委员会委员,多年来一直致力于视频信号编码/压缩、视频通信的研究。在她看来,要传输足够大的视频信号必须有足够的带宽,而在1Mbps的带宽下,理论上根本不可能实现真正的高清视频通信。而厂商方面的观点则认为,自己的产品已经具备在1Mbps带宽下实现高清的能力。

  事实上,为专家和用户所质疑的高清视频会议系统并不仅仅是这家厂商。从目前的市场来看,大多数厂商们所宣称的高清视频会议系统离真正的“高清”还有较远的距离,它们的音视频传输质量只是比传统视频会议系统有所提高而已。

  一方面是厂商的大力宣传,一方面是专家的质疑,高清视频会议市场让人很是看不清楚。那么,现在的视频会议系统是否已经能够实现高清了呢?什么样的产品才算是真正的高清呢?用户是否真的需要高清视频会议系统呢?这一切都需要拨开市场纷扰的表象,才能有更进一步的了解。

  纷扰的市场

  其实,视频会议行业对于高清的炒作早在2005年就已经达到了顶峰。及至2005年下半年,一些厂商意识到高清的实现和市场的成熟将是一个漫长的过程,继而开始转向务实。但即便如此,“高清”依然是众多厂商的方向。

  据计世资讯(CCW Research)的调查显示,目前我国视频会议系统市场上共有140多家厂商,但活跃在市场上的主要厂商只有10多家,共占据42%的市场份额。它们其中既有前几年逐步进入中国市场的国外视频巨头,也有近年来涌现出的国内视频会议系统厂商新秀。而目前宣称要帮助用户实现高清视频会议的厂商也有10多家,市场上活跃的视频会议系统厂商基本上都在其中占有一席之地。有消息称,目前还没有高清视频会议系统的Polycom也将于10月份推出自己的高清产品。

  在厂商们看来,推出高清视频会议系统可以满足很多用户的需要。根据美国经济咨商局(The Conference Board)《2006年首席执行官面临的挑战》(CEO Challenge 2006)调查报告显示,75%的CEO最关注的是企业对市场的反应速度、灵活性及适应性。另外,美国商业协会组织近日在一个研讨会上针对一些香港商业先锋企业做了一项调查,被调查者大都认为在危机突发时,能够在远端继续工作,并保持企业内部联系和客户交流最为重要。

  显然,厂商们认为,高清视频会议系统就是专为解决用户的诸多困惑而设计。泰德方面表示,通过在办公室和会议室安装高清视频会议系统,利用极致清晰的图像及视频传输,可以使分散在各地的团队高效沟通,并加强与客户、供应商及商业合作伙伴的沟通。LifeSize中国区总代理赵霆表示,政府、制造、教育等行业对高清视频会议系统的需求已经开始显现。

  根据赵霆提供的市场预测数据显示,2006年作为高清产品的成长期,2007年将会是高清产品的普及期,整个行业将在2008年完成产品的全部转型,标清产品将退出主流市场并逐渐被淘汰。但显然,许多厂商并没有如此乐观。Radvison中国区总经理李平明确表示:“用户对高清视频会议系统实在、具体的需求最早要明年6月份才会真正出现。”

  “大多数厂商所谓的高清视频会议系统还只是演示版,在局域网上传输或许没有问题,但在公网上根本跑不起来。”在李平看来,做出上述判断的原因一方面是用户视频会议系统的采购周期,更为重要的则是因为视频会议系统厂商的产品还不成熟。

  我们不妨来看看目前市场上的高清视频会议系统。科达的产品是采用MPEG-4编码做的,这种技术在细节、色彩还原和传输能力等方面都比H.264编码有所欠缺;在笔者拿到的泰德8款高清视频会议系统的宣传资料中,基本上都没有注明清晰度,仅有95MXP的内部培训资料上写有清晰度,而其每秒15帧的传输速度也无法满足高清视频传输30~60帧/秒的需求;LifeSize虽然宣称能在1Mbps的带宽下实现高清视频传输,但这需要对公网的QoS质量进行优化,而这必须由电信运营商来进行,用户和厂商根本无法在具体的项目中实现。

  虽然高清是视频会议系统的发展方向,而厂商根据H.264编码这一开放性协议也都能最终开发出高清视频系统,只是时间的早晚不同而已。但就目前而言,厂商提供的高清产品只是比传统的视频会议系统有一些改进而已,距离真正的高清都还有一些距离。

  视频通信质量之痛

  现在,视频会议系统正迅速成为许多企业必不可少的沟通手段。由于企业大多采用的是基于开放标准的解决方案,支持多媒体视频协议,并具有未来的可扩展性,要实现视频沟通并不复杂。只要用户正确建立起网络架构、管理系统及基础设备,就可以确保及时业务沟通的实现。

  不过,在传统视频通信技术标准下,由于受到视频通信应用技术和音视频编解码技术发展的制约,传统视频通信技术没有从根本上解决通信过程中的图像和声音问题,低等级的视频质量无法满足用户对高清晰图像质量的特殊需求。

  在赵霆看来,只有高清晰的图像质量才能更好地营造面对面的会议效果,而不少传统视频会议系统的画面质量则很难达到这样的效果。笔者也曾在一些政府机构看到,投入大量资金建成的视频会议系统,其主要功能竟成了机构内部的放映室。究其原因,主要是因为画面质量很难满足会议的需要。

  传统视频通信的主要问题在于,经过编解码后的图像在解析度、色彩还原度等方面和真实场景有较大的差距。造成这一现象的原因,一方面是由于编解码设备的编解码效率低、链路动态适应能力差等诸多因素导致对真实场景还原失真。另外在音频方面,传统的50Hz~7kHz只能感受到较窄的音频宽度并不能对现场环境和声音特征进行有效还原,需要音频编解码提供更高的音频采样率,以实现更宽的音频效果。

  但在现实应用中,人们对于视频和音频的要求越来越高,例如远程医疗、远程手术、远程维修等需要通过视频通信这一过程实现对现场情况的精确视频传输(高清晰视频应用)。笔者的一位医生朋友表示:“高清视频会议可以帮助身处异地的医生进行面对面交流,分析X光片、MRI核磁共振影像、超声检查结果或者 ECG心电图结果,从而依据大量的细节作出诊断。”要满足这些需求,就需要厂商能提供更高视频通信质量的高清晰视频会议系统。

  高清视频会议系统带来的好处是显而易见的。清晰的画面质量、同步音效和最低时延帮助与会者保持注意力并提供高效、高质量的视频会议体验。例如,在16∶9的屏幕比例中展示图像使显示角度更宽,从而让更多的与会者出现在画面中,保证全身心地投入到即将召开的会议中。一位化工行业的CIO表示:“只要价格合理,高清视频会议系统更容易得到人们的青睐。”

  不过需要注意的是,高清视频会议与高清电视有着较大的不同。高清电视可以保持固定的信号质量,而视频会议的质量可能会因为网络传输大量数据而降低。比如,编码/解码过程和通过网络传输大量数据信息所消耗的时间可能造成处理过程的延时;过多的延时会增加语音重叠的机会,并有可能造成视音频不同步;长时间的延时可以通过音频效果明显地表现出来,劣质的音效能严重影响整个视频会议体验的整体质量。

  谁是真正的高清

  用户要实现高清视频会议,必须所有的终端都是高清兼容设备,都要支持高清数据压缩,从而视频会议的所有参与者都可以享受高清视频。这就要求用户要拥有高清摄像头、高清视频显示器、高清MCU,以及足够的带宽。

  但随之而来的问题是,什么样的产品可以称得上是真正的高清视频会议系统。要解答这一问题,我们不妨从视频和音频两方面来分析。

  1.视频要求

  视频通信应用作为一种多媒体应用方式同样需要遵循各标准组织所倡导的高清晰多媒体标准。当前高清晰数字电视(HDTV)所倡导的视频解析度主要有三种格式,分别为720P、1080I、1080P (其中“P”为逐行扫描方式,“I”为隔行扫描方式)。而高清晰视频会议系统主要应用格式为720P——即逐行720线。

  视频会议采用逐行扫描的原因在于,视频会议场景通常对动态图像要求不大(特殊领域除外),图像动态变化也较小,但对图像的细节要求却很高,同时还要保证图像的稳定性。而这些都是采用隔行扫描1080i(PAL制每秒钟扫描50场,分别对水平方向的奇数行和偶数行进行扫描,每场的实际解析度仅有540线)所无法满足的,因此在扫描方式上采用逐行扫描,能够更稳定地显示画面的细节,使得画面更加清晰。

  在媒体流处理方面,需要将大量的原始视频音频数据流进行编码压缩后在传输链路上进行压缩传输。高清晰音视频流(720P)所处理的视频流是传统CIF格式流的10倍。如果采用更大解析度格式的视频图像,如1080P,会造成原始媒体数据流更为巨大,从而影响视频编码效率,降低通信过程的实时性,增加延迟,同时也是对图像实时压缩技术的考验。因此,视频会议系统的建设,无论是建设标清还是高清晰视频通信系统都要综合考虑用户对系统建设的投资,让用户付出相对较低的成本,得到最大的收益。

  采用过高的视频图像格式(1080P)进行媒体流的处理,会使DSP的成本增加,同时也会相应造成用户整体成本的增加,例如视频会议系统的周边配套设备——高清晰显示设备、回放设备、存储设备和主要的摄像采集设备,都要符合高清晰通信的规程(高清晰视频通信是一个完整的端到端系统),而这些设备的价格都远超其他设备,会使得整体成本大幅提升,但给用户所能带来的实际效果提升却并不明显。因此,采用720P视频格式作为图像解析度的格式能够使整体系统达到最佳的性价比,能够有效地降低用户的采购成本,避免投资浪费。

  在图像的幅面显示方面,目前高清晰显示设备均可以同时支持4∶3和16∶9两种显示方式。传统视频会议系统多数采用4∶3显示方式,而高清晰视频会议系统在视频格式幅型比上应采用更为符合人眼观赏习惯的16∶9的显示方式来替代传统视频会议系统采用的4∶3的显示方式,这是因为屏幕显示区域在垂直解像度(线数)相同的情况下,采用16∶9显示方式可视面积比4∶3显示方式的可视面积要增加20%左右,单帧画面可容纳更多的视频信息,这样视频通信中,用户就可以获得更大角度的视频图像。

  从上述的分析来看,在对高清晰视频通信视频图像的最佳选择应该是:选择720P视频格式、16∶9幅面的高清晰视频标准。

  2.音频要求

  视频通信过程是视频和音频的实时双向完整通信过程。在这个过程中我们为了获得高清晰视频图像,有时却忽略了另外一个重要的过程——音频通信过程。如果我们在观看高清晰视频图像的时候,不能得到一个更清晰、连续的音频效果。那么这个过程实际上就没有任何意义,所以其重要性甚至超过视频。在传统的视频会议系统中音频技术发展极其缓慢,原因在于目前应用于视频通信的音频编解码压缩标准都是为了保持传输时的低带宽占用和较高的编解码效率,从而将音频信号的采样频率、采样精度和采样范围指标做了极大的降低,使得所能提供的音频清晰度和还原性都有很大程度上的衰减。与用于存储和回放非实时压缩协议的标准(如OGG、MP3等)相比,音频的保真度非常低。这样就在某种程度上使现场声音的还原达不到要求。

  目前,传统视频通信过程中主要采用的是G.711、G.722、G.722.1、G.728等音频标准,音频宽度仅有50Hz~7kHz单声道,而人耳所能感知的自然界的频响能力可以达到20Hz~20kHz。因此,在对现场环境音的还原过程中过多的音频信息的丢失造成了无法真实表现现场情况。所以在高清晰视频通信过程中我们势必要有一种相辅助的音频处理方式解决此问题。使整个高清晰通信过程更近于完美。

  目前国际上对音频处理技术上标准较多,在对下一代实时交互音频处理上可以采用MPEG-1 Layer 2或AAC系列音频,对选用标准的原则是,音频频响范围要达到22kHz,这样就几乎可以覆盖了人耳听觉的全部范围,甚至在高频方面还有所超越,能够使现场音频得到真实自然的还原,并且在还原时可以采用双声道立体声回放,使整个视频通信的声音有更强的临近感,达到CD级音质。同时在对链路带宽的适应和编解码效率上达到最佳。附表列出了AAC的9种规格。

  可以看到,我们在对宽频音频的支持上可以选择MPEG-1 Layer 2或AAC系列标准,而AAC的每种格式均有各自的特点。从总体来说,为用户提供CD级的宽频音频是新一代高清晰视频会议系统所追求的方向。

  标准之争

  在视频会议应用中,视频质量和网络带宽占用是矛盾的,通常情况下视频流占用的带宽越高则视频质量也越高;如要求高质量的视频效果,那么需要的网络带宽也越大;解决这一矛盾的钥匙是视频编解码技术。评判一种视频编解码技术的优劣,是比较在相同的带宽条件下,哪个视频质量更好;在相同的视频质量条件下,哪个占用的网络带宽更少。而基于H.264——高清编解码技术很好地解决了这个问题。

  在高清编码/解码技术产生之前,视频会议数据是基于通用交换格式 (CIF) 进行编码的。国际电信联盟-电信标准部(ITU-T)制定了视频标准,称为H.261和 H.263。H.261 标准只定义了 QCIF 和 CIF 格式。四分之一 CIF (QCIF) 格式只被用于最低数据率(64 千位/ 秒及更低)的会议,目前已经很少使用。自从H.263 标准发布以来,更多使用“全分辨率”(定义为 16CIF)的格式,4CIF 和 16CIF逐步被采用。由于采用此类标准时,计算和带宽的限制,用于全动态视频会议的通用分辨率仍然是 CIF 到 4CIF。

  为了减小整个视频文件的大小,使文件可以更经济地通过容量更小的网络连接进行传输,从而更加有效地利用网络带宽,使网络资源更加经济有效。ITU-T和ISO/IEC的联合开发组共同开发了最新国际视频编码标准——H.264/MPEG-4 AVC(H.264),该标准通过比较低的数据传输率提供高质量画面。通过该标准,在同等图像质量下的压缩效率比以前的标准提高了2倍以上,因此,H.264被普遍认为是最有影响力的行业标准,已成为HD-DVD(高清DVD)以及广播、有线、视频会议和消费电子产品的强制标准。

  H.264是继MPEG-4之后的新一代数字视频压缩格式,它既保留了以往压缩技术的优点和精华又具有其他压缩技术无法比拟的许多优点:低码流(Low Bit Rate)、高质量的图像、容错能力强、网络适应性强等特点。与MPEG-2和MPEG-4 ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG-2的1/8、MPEG-4的1/3。显然,H.264压缩技术的采用将大大节省用户的下载时间和数据流量收费。

  更为重要的是,H.264编码标准提供了更强的灵活性,为不同的开发商提供了互联互通的通用平台。H.263标准支持众多不同的版本,而H.264标准只包含极少的压缩技术。这样一来,可以在不明显降低视频质量的前提下更轻易地实现多生厂商不同视频会议设备的集成。

  由于H.264在图像压缩率、图像清晰度、容错能力、网络适应能力等方面的优异性能,H.264不仅成为高清视频会议最主要的实现标准,过去采用MPEG-2、MPEG-4实现视频会议的厂商也纷纷向H.264转型。现在,H.264正逐步替代H.263、MPEG-2、MPEG-4等视频编码标准。

  漫长的成熟之路

  “用户在高清视频会议系统的投资,基本上与高端的传统视频会议系统的价格差不多。”赵霆表示。不过据计世资讯的调查显示,随着技术的逐步成熟以及市场竞争的加剧,国内各视频会议系统厂商将逐步降低产品价格,在推动视频会议系统市场进一步发展的同时占据更多的市场份额,降价幅度有望达到20%左右。届时高清视频会议系统是否会迅速降价还不得而知。

  同时,高清视频会议系统市场的成熟还需要解决两个技术方面的难题:大力提高图像清晰度、简化设备。在图像清晰度方面,随着芯片和图像处理方面技术的发展,H.264这一主流标准有望在技术上得到进一步完善。“技术上还要继续往前一步,比如帧率完全可以提高到60帧/秒。”赵霆这样表示。

  一直以来,视频会议的设备都比较庞大,不方便使用,且设备复杂,不适合安装、调试和使用。目前各个厂商和科研机构,正努力促使这些设备走向小型化。此前,Polycom公司曾推出一款小型的视频会议系统,使视频会议设备的小型化、简便化深入人心。这一点,在促进高清视频会议系统市场的成熟显得意义重大。

  另外,产品的丰富性也需要增加。目前厂商推出的高清视频会议系统主要还是会议室型的,以后可以推出桌面型、便携式、机房式等不同种类。而在专业应用方面,厂商也需要加大投入力度。“如果想让整个行业有个理想的增长量,需要为产品增加各种各样不同的功能、接口,从而有更专业的产品来满足企业用户的需求,并最终开发出适应不同行业的专业产品。”在赵霆看来,注重行业特性将是产品下一步的发展方向。


  “如果网络错误率在3%的情况下,高清视频会议系统还可以跑出比较好的情况,传统的视频会议系统就会出现很多马赛克。即便出现马赛克,高清系统是条状的,且很快恢复,但传统系统的纠错能力则较差,马赛克会蔓延成一大片。”在一些厂商看来,即便目前不能真正达到高清的效果,在现有网络状况下,高清视频系统的效果也要强于传统的视频会议系统。加上价格相差不大,一些对高端视频通信有需求的用户已经可以考虑采用高清视频会议系统。

  不过也有观点认为,高清视频会议虽然是方向,但目前仍不太成熟,短期内还不可能成为大多数视频会议厂商的主推对象。据计世资讯预测,今年的视频会议系统市场将以30%的幅度继续增长,2007年更是达到50%的增长幅度。而有数据显示,全世界有3000万个会议室,但部署了视频会议系统的仅有75万个左右。可以看出,传统视频会议市场还有较为庞大的市场空间,大多数厂商会将主要的人力、物力放在其中,而这在很大程度上也将使得高清视频市场的成熟之路显得更为漫长。

  选购指南:如何挑选视频会议系统

  1.图像评测方法

  通常所说的高清视频会议系统,在图像表现方面比传统视频会议系统更为清晰细腻、色彩还原度高。在选择高清视频会议系统时需要对图像效果这一重要指标进行评价。定量的客观分析方法是用“解码重建图像”偏离“编码前的原始图像”的程度来衡量图像重建的质量,比较均方误差MSE和峰值信噪比PSNR,MSE越小、PSNR越大,图像压缩所引起的损失越小、图像质量越好。但客观分析方法没有考虑人眼的感知特性,会带来计算结果和人眼视觉感受有所偏差,加之测试条件复杂,目前难以广泛应用到图像评价中。

  在日常评价中,主要采用通过人眼观察进行评判的主观分析方法。测试时通常采用平均判分法MOS(Mean Opinion Score):选择一批观察者,在限定条件的环境中连续观看一系列的视频测试序列大约10~30分钟,让他们对视频序列的质量进行评分,求得平均判分后,再对所得数据进行分析从而获得最后结论。受控的环境包括:观看距离、观测环境、视频测试序列的选择、视频测试序列的显示时间间隔等,详细评测方法在国际标准ITU-R BT.500、国家标准GB 7401-87(彩色电视图像质量主观评价方法)、国家广电行业标准(GY/T 134-1998,数字电视图像质量主观评价方法)中都有描述。

  为了更好地对各厂商的设备进行对比,通常将各厂商的设备同台对比测试,为所有设备提供同一视频源,分别播放4∶3格式大运动量的DVD、色彩鲜艳远近景层次分明并含字幕的场景、现场图像等,通过解码后的图像和原图像对比、各厂家图像综合对比等方式,对图像流畅性、分辨率、色彩还原度等方面进行综合评价。

  需要注意的是,DVD碟片需采用4∶3格式,是因为图像编码器默认格式为4∶3,如采用16∶9信息源,图像上下两大部分黑屏内容的图像信息量实际为0,不能充分考验编码器的实际编码能力。

  2.确认H.264的实际实现能力

  如何选取更强的DSP芯片进行组合设计,并基于DSP不断进行图像算法优化、实现H.264更低带宽下更优异的图像质量是一个长期而艰巨的过程,也是考验视频会议系统厂商技术实力和商用能力的重要因素。

  目前视频会议行业存在一些关于H.264实现能力的不实宣传,如“支持8Mbps带宽下H.264 4CIF分辨率”(实际上以MPEG-4 Part2或H.263混充H.264、以2CIF分辨率混充4CIF)等,宣称能力相比真实能力大打折扣,既无法和真正的H.264系统直接数字互通,而且和目前的DVD图像质量也有一定的距离,这样不仅误导客户,对视频会议系统的互通性和性能扩展也会带来极大的技术隐患。

  因此,为了更好地评价设备厂家对H.264新技术的支持能力,为系统的建设和规划提供科学的参考依据,建议在视频会议系统选型或应用时,在主观评测图像质量的同时,能配合截包工具,对系统的实际媒体码流进行截包并委托权威机构进行分析,以验证各厂家关于编码算法、支持带宽及分辨率的确切实现能力,有效保护客户的合法权益。

计算机世界网(www.ccw.com.cn)



相关链接:
视频会议系统的建设要注重合适的前期规划 2006-09-22
视频会议系统变局 2006-09-22
多媒体会议中的H.264编码 2006-09-22
高清视频会议系统——超越标清 2006-09-22
视频会议系统已成为美国主要教学工具之一 2006-09-19

相关频道:  市场动态_与_视像通讯           文摘   市场动态   技术_视像通讯_文摘