前言
说起视频客服,这不是一个新名词。早在2010年,随着3G技术的成熟,移动网络和移动终端得到长足进步,运营商们纷纷设置了视频客服来为客户提供多样化的服务,希望利用这个新型的服务方式为客户提供更好的服务体验。可实际上3G时代的移动端下行速率和网络容量都不足以支撑实时的交互业务,移动设备运算能力也远远低于预期的水准,这导致最终视频客服业务未真正得到运用。
但是随着5G时代的到来,移动端网络速度急剧提升,从3G的1-6Mbps,100K/s左右的下载速度到5G时代可以达到1000-10000Mbps,100M/s的下载速度,实时视频通讯不再是“空中楼阁”,视频客服又再次成为讨论热点。
应用场景
视频客服的优势在于结合了电话服务的实时性和在线服务的多媒体展示,这不仅能提高服务效率,还能提升客户的使用体验。同时基于视频实时通讯,AI在客服领域的应用也从声音感知和文本认知进化到多模态的感知认知组合。基于这些元素,视频客服主要的热门应用场景有以下几个:
远程柜台
由于图像图形智能技术在中国的高速发展,在手机终端进行客户身份核验已经得到了广泛应用。所以结合声纹、人脸识别等技术,我们可以在视频客服场景实现以往做不到的身份验证、欺诈识别功能,这样在线下柜台能进行的大量个人业务都能够得到线上办理的可能。
在线医疗
医生专家能够在视频中直接了解客户的现状、解读X光片,快速为患者提供诊疗方案,这使得患者和医生都减少了许多线下繁琐程序带来的负担。
售后服务
视频服务对于复杂售后问题的处理非常有帮助。例如用户在网上购买的电视坏了,仅需把产品在视频中展示,客服人员就能够直接了解用户遭遇的状况,直接给予解决方案,甚至通过自己在另一端的实物操作指导用户。
销售业务
营销人员能够通过视频直接展示产品,用户也可以通过视频了解产品的实际情况,通过互动体验解决对于产品的疑惑。当下,非常火爆的直播带货也是同样的原理。
讯飞视频客服技术方案
由于不同公司的技术路线和业务方向不同,技术方案的组成较为不同。下面,主要基于当前科大讯飞智能服务的技术方案做个介绍。

流程图
讯飞的视频客服方案较其他的视频客服方案增强了AI能力的应用,通过对客户侧的音视频资料进行语音语义分析、表情和动作的分析,一方面辅助人工坐席服务客户,另一方面还可以自动智能地为客户提供服务。
技术难点及解决方案
当然,在视频客服落地过程中,不可避免的会面临着一些技术难点:
弱网对抗
哪怕在5G时代由于移动端和跨地域通信还是会存在弱网问题,网络信号差,网络速率低,此时需要找到办法让服务的质量不下降,一般可以从两个方面着手这些问题:
● 多流同步,在视频源生产视频的时候生产不同清晰度和码率的视频,在客户侧信号弱的时候可以推送质量稍差的视频,此时网络带宽的需求就会大大降低,但是服务本身几乎不会受到影响;
● 高质量码控和流控算法,诸如对丢包和错序的纠错,最小化速率波峰波谷的差值,实时的非关键帧跳帧处理等,这样能够最大程度保护视频的播放质量。
人机协同
在视频客服交互过程中,人机协同的过程会更加复杂,此时需要弱化这些复杂的过程,引入了两个切入点:
● 智能知识库,机器人通过生产知识的方式,智能辅助人工,知识库对机器人分析的产物进行整合输出结构化的知识,推荐给人工或者提醒人工;
● 智能对话,将机器人的行为抽象成对话动作由对话统一对外交互,人工客服可以通过该系统直接干预机器人的行为,减少了干预难度。
视频资源存储
与以往的电话客服和多媒体消息交互不太一样的是,视频文件资源普遍占用磁盘空间较大,我们无法像以往一样对存储漠不关心,否则视频资料的存储会占用过多的机器资源导致成本剧增。主要是通过以下手段解决该问题:
● 抽样存储,与客服后端联动,仅对关键视频段进行存储,不录制全视频;
● 视频压缩,通讯和存储采用不同编码,存储使用高压缩率的编码和压缩算法尽量保证资料的不丢失,对必要的视频帧做单独的处理保障高清。
展望未来
当前视频客服正属于预热阶段,有很多互联网公司正在向此领域进军,行业尚处于起步阶段。
科大讯飞的优势在于已经具备成熟的音视频媒体平台、强大的认知感知技术以及在客服领域积累的巨大经验财富,在产品体系思路和落地方案上是处于行业前沿的水准,也曾在客户POC中赢得不错的口碑。
同时,科大讯飞也在工程化、应用化、业务化的方向继续探索,深入客服场景,挖掘并解决客户的深层次需求,打造一个围绕客服、办公的全面的体系,始终努力在技术和应用上,走在行业的前沿。