首页>>>技术>>>计费  计费产品

容灾—让BOSS更美好

南京联创科技股份有限公司 戴宁海 2004/05/24

  随着信息技术的发展,电信运营商越来越依赖于计算机系统来进行它的商业行为,保证其在业界的竞争力。业务支撑系统的高可靠性和高可用性越来越成为运营商关注的重点。

  对电信运营商来说,如果发生数据丢失,轻则影响业务的开展以及客户满意度,严重的将会使整个企业的生产过程瘫痪。有研究显示,企业在遭受灾难之后,如果无法在14天内恢复数据,有75%的公司业务会完全停顿,43%的公司再也无法重新开业,有20%的企业在两年之内被迫宣告破产。造成这些损失的原因不仅仅是火灾、水灾、地震等自然灾害,还有诸如战争、蓄意破坏、严重误操作等人为因素。因此,在限定时间内成功的灾难恢复应作为电信运营商企业战略中的一个关键组成部分。

  BOSS系统是移动运营商的业务支撑系统,其中各个子系统的重要性有所差别,因此,在考虑BOSS系统容灾时,就要针对不同子系统采用不同的容灾策略。首先,营帐系统直接面向最终用户,是业务受理和用户感受移动服务的直接窗口,其重要性不言而喻。所以,最先考虑的应是营帐系统的容灾,保证在遭受灾难之后,营业活动能在最短时间内恢复;其次,计费系统涉及到用户的实际费用的收取,是用户帐单产生的主要来源之一,尤其是现在很多移动运营商基于计费系统开展了很多省内预付费业务,如果计费系统处理不及时,将会造成大量话费损失,因此计费系统的容灾也是势在必行;再者,联机指令直接关系到用户业务受理的最终实现,也必须考虑纳入容灾系统的建设范围。其他诸如统计查询等非关键业务则可根据运营商各自的情况来具体考虑。

  容灾可分为数据容灾和应用容灾。数据容灾可保证数据不丢失,但不能保证服务不中断;应用容灾则更上一层楼,它在异地建立一套与本地数据系统相当的冗余系统,当灾难出现后,远程系统可迅速承接本地应用系统的业务,保证服务基本不中断。根据对系统实时性、中断敏感性、数据更新频度、数据量大小、相关条件等不同要求,容灾备份可采用各种技术或多种技术的组合。以下就对各种常用的容灾备份技术作一简单介绍。

  利用磁带拷贝进行数据备份和恢复是常见的传统灾难备份方式。使用这种方式的数据拷贝通常是存储在盘式磁带或盒式磁带上,并存放在远离生产系统的某个安全地点。磁带通常是在夜间存储数据,然后被送到储藏之处。而在灾难或各种故障出现系统需要立即恢复,将磁带提取出来,并运送到恢复地点,数据恢复到磁盘上,然后再恢复应用程序。这种方式的实现过程复杂,恢复效率低,已越来越不适合用户不断发展的业务系统的需要。

  对数据库系统可采用远程数据库复制技术来实现容灾。这种技术是由数据库系统软件来实现数据库的远程复制和同步。基于数据库的复制方式可分为实时复制、定时复制和存储转发复制,并且在复制过程中,还有自动冲突检测和解决的手段,以保证数据一致性不受破坏。其实质是实现主、备用系统的数据库的数据同步(实时或者准实时同步),即是将主用系统数据库操作Log实时或者周期性地复制到备用系统数据库中执行,实现二者数据的一致性。远程数据库复制对主机的性能有一定影响,可能增加对磁盘存储容量的需求(包括对Log的存储),但系统运行恢复较简单,在实时复制方式时数据一致性较好,所以对于一些对数据一致性要求较高、数据修改更新较频繁的应用可采用基于数据库的容灾备份方案。利用这种技术实现容灾的解决方案有Oracle的Data Guard和Quest的SharePlex。

  目前业内实施比较多的容灾是基于智能存储系统的远程数据复制技术。它是由智能存储系统自身实现数据的远程复制和同步,即智能存储系统将对本系统中的存储器I/O操作请求复制到远端的存储系统中并执行,保证数据的一致性。由于这种方式下数据复制软件运行在存贮系统内,因此,较容易实现主中心和容灾备份中心的操作系统、数据库、系统库和目录的实时拷贝维护能力,且不会影响主中心主机系统的性能。如果在系统恢复场所具备了实时数据,那么就可能做到在灾难发生的同时及时开始应用处理过程的恢复。但这种方案也有开放性差(不同厂家的存储设备系统一般不能配合使用)、对于主备中心之间的网络条件(稳定性、带宽、链路空间距离)要求较苛刻等缺点。HP的CA、IBM的PPRC、EMC的SRDF以及HDS的TrueCopy技术都用于实现基于智能存储系统的远程数据复制。

  最后要说的是基于逻辑磁盘卷的远程数据复制技术。我们通常将物理存储设备划分为一个或者多个逻辑磁盘卷(Volume),便于数据的存储规划和管理。逻辑磁盘卷可理解为在物理存储设备和操作系统之间增加一个逻辑存储管理层。基于逻辑磁盘卷的远程数据复制是指根据需要将一个或多个卷进行远程同步(或者异步)复制。该方案通常通过软件来实现,基本配置包括卷管理软件和远程复制控制管理软件。远程复制控制管理软件将主用节点系统的卷上每次I/O的操作数据实时(或准实时或延时)复制到远程节点的相应卷上,从而实现远程两个卷之间的数据同步(或准同步)。主、备节点之间通常需要配置相应带宽的IP通道。基于逻辑磁盘卷的远程数据复制会增加各节点主机的一些处理性能需求,在此前提下且通信带宽保证时,远程复制效率和数据一致性可得到保证。基于逻辑磁盘卷的远程数据复制因为是基于逻辑存储管理技术,一般可与主机系统、物理存储系统设备无关,对物理存储系统自身的管理功能要求不高,有较好的可管理性,也便于主、备系统的扩充和发展。同时,也可方便做到多个节点对一个节点或一对多的远程数据复制。利用这种方式的典型解决方案是Veritas的VxVM+VVR。

  容灾的方式和技术这么多,那么对于移动运营商来说应如何实现BOSS系统的容灾呢?这个问题要从多种角度去看。从硬件平台的角度来看,如果生产中心和容灾中心选用同一厂商甚至同一型号的设备,那么采用基于智能存储系统的远程数据复制技术就可优先考虑;相反,如果是异构平台,无法在磁盘阵列的层面实现数据复制,那就需要考虑从数据库或磁盘卷的层面上去实施容灾了。另外,从BOSS系统本身来看,不同的子系统可采用不同的容灾方式。比如可利用应用的解决方式,将批价后等待入库的文件传递多份,实现计费系统的容灾;而对于营帐系统的容灾,可利用智能存储的底层复制技术来实现。

  对于容灾,还有一个重要的问题需要明确,那就是容灾不仅仅是技术,而是一个工程。目前很多客户对容灾的关注还停留在技术上,而对容灾的流程、规范以及实施的具体过程还不太清楚。另外实现灾难恢复方案将会是一个漫长的过程, 不管采用何种技术,必须确保解决方案的可行性,要经过不断地测试、演习来完善容灾的流程。

中国计费网(www.billingchina.com)


相关链接:
容灾项目需要注意的几大问题 2004-05-24
固话计费 帐务优惠 2004-05-24
电信核心业务系统容灾解决方案 2004-05-24
云南联通容灾实施案例 李卫民 2004-05-24
应用集成:最大化电信OSS效能 2004-04-26

分类信息:  电信_与_计费     文摘   行业_电信_解决方案   技术_计费_文摘