大话务量冲击对通信系统有什么危害?
- 通信系统有容量限制,长时间超出设计容量的话务量冲击会使通信系统设备出现CPU过载、消息队列溢出、内存不足等故障,将导致设备宕机重启、服务中断。
- 通信系统的网络交换和中继资源是有限的,大话务量可能消耗光所有资源,新发起的普通呼叫甚至高优先级呼叫系统无法接续,对外呈现出服务中断的状态。
- 某些局向由于话务量过高,中继电路全部占用,该局向新发起的呼叫无法接续,使该局向的业务(譬如接入的是某呼叫中心)对外呈现出服务中断的状态。
- 面对大话务量的危害,我们有三大应对策略,能让通信系统在大话务量的冲击下,仍然能保证设备正常运行,服务不中断,新发起的呼叫能够接续。
策略一
合理的网络规划与临时路由资源调配相结合
通信系统一般根据忙时话务量来规划设备容量和中继数量,中国国标是参考负荷A,即一年12个月中选最忙的10个工作日的最忙1小时的话务量取平均值。语音呼叫的用户行为符合典型的泊松分布,根据通信系统的话务量和中继数可以计算出呼损率,即爱尔兰B公式:

此处B是呼损率,A是话务量,n是信道数,对于呼叫中心相当于中继电路数。
将爱尔兰公式计算后制定成表格,就可以根据话务量和服务等级(呼损指标)反查信道数,以此来作为通信系统的规划依据,如下表所示。

举个栗子:
玖云平台某一局向对接的呼叫中心忙时平均接入9000个呼叫,平均通话时长120s,在呼损指标1%的要求下,需配置多少中继?
忙时话务量A=9000*120/3600=300 erl。查爱尔兰B表,所需电路数=324,约11条E1。
规划了系统容量之后,在重大事件期间,话务量还是可能超过系统容量,对于可预测的事件,为保障服务质量,还需预先临时调配资源规划路由:
- 规划备用路由,将一部分话务量分配到负荷较轻的路由上,错峰使用中继资源。
- 临时增加设备和中继资源
策略二
通信设备支持流控机制
由于通信业务的突发性,无论如何规划系统容量,还是会存在峰值话务量远超过系统容量的情况出现,为保障设备的正常运行和服务的不中断,需要引入流控机制。
根据系统资源使用情况,如CPU占用率、内存使用率和消息缓冲队列使用率,设置一系列流控启动阈值,若资源占用超过阈值,就按比例拒绝一部分呼叫;同时设置一系列流控恢复阈值,若资源占用低于恢复阈值一段时间,就取消流控。为防止系统在启动与恢复流控之间乒乓切换,恢复阈值应该比启动阈值略低一些。
为适应不同情况的话务量冲击,一般采取2-4级分级流控,资源占用越多,会触发更高级别流控,限制更高比例的呼叫。
流控机制使系统在大话务量冲击下,一直保持有部分资源空闲,可以避免引发系统重启宕机,同时剩余的资源还可以接续一部分呼叫,避免服务完全中断。
效果如图所示:

除了根据系统自身资源使用情况出发流控以外,还应考虑网络上某些设备可能不具备流控功能,此时应该针对某些局向进行流控,当某局向中继占用率达到一定比例后进行限呼,防止过大的话务量冲击使对端设备宕机或者服务中断。
流控过程中被拒绝的呼叫,为防止用户马上重拨导致新产生话务量,在资源允许的情况下可以通过IVR放音提醒用户挂机且不要立刻重拨。
如果系统可以识别高优先级呼叫或者高优先级用户,对于此类呼叫原则是不受流控的限制,保障其在大话务量冲击下依然可以随时接通。
策略三
快速响应的维护保障
快速响应的维护保障
在618期间,玖云平台平台安排专业的人员值班,保持7*24快速响应,以应对突发性的事件。此外,还会对日常数据进行监控,对节假日话务量进行及时地分析和预测,并据此做出应对预案,包括设备扩容,资源调配,参数设置,并提前与客户做好沟通。
作者简介:陈捷,2016年加盟大众通信,现任大众通信首席战略官;毕业于南京大学,曾就职华为12年,分别在海外交换机、信令部、中东北非无线MKT、WiMAX带领过研发、产品、市场团队。有二十年的设计与开发经验,熟悉产品拓展、市场运作、团队管理,有多年海外工作经验。对通信、互联网趋势理解经验丰富、嗅觉敏锐。