首页>>>技术>>>计费  计费产品

湖南移动通信公司业务运营支持系统(BOSS SYSTEM)系统案例

Annie 2009/07/23

项目简介(功能与用途):

  湖南移动通信公司业务运营支持系统(BOSS SYSTEM)系统是整合营业、计费、结算、账务、收费等业务,实现"以客户为中心、业务的开发和管理面向客户、网络管理面向业务"的运营原则,大大提高企业的营销和服务水平的核心业务支撑系统。

项目难点与解决方案:

  BOSS系统从2003年初开始陆续上线,营帐系统在上线运行后出现性能问题。主要表现在对最终用户的交互响应不如预期,尤其在业务繁忙时更是无法得到及时的交互响应。从主机(AIX)系统上观察,主要表现在系统的I/O等待较大。营帐系统是由业务应用程序,Oracle数据库,AIX主机,IBM ESS存储多个部分组成,因此性能瓶颈的定位和性能的优化都比较复杂。

该项目的难点主要由以下几点

  1. 湖南移动通信BOSS SYSTEM系统是一个大型的复杂系统。在这个系统中从上至下包括以下几个层次:应用程序、数据库、主机系统(操作系统)、SAN网络和ESS存储系统。在发生系统的性能问题时,性能问题的定位和调优就很复杂。

  2. 数据库容量大,整个数据容量有约2120GB,整个数据的迁移需要几十个小时的时间,而在生产系统上是不允许有很长的停机时间进行数据迁移。

  3. 湖南移动BOSS系统是7×24的应用,不允许停机。

  4. 应用中部分SQL语句非常复杂,而且SQL语句的写法和谓词等方面使用不当,直接造成低效率的SQL运行,占用系统I/O和内存,需要找出这些SQL语句并对之进行调整。

  5. 需要对Oracle数据库部分参数作出调整。

  6. 需要对操作系统内核参数作出调整。

  7. 需要对数据库的数据在ESS存储上的物理分布重新

对于上述问题,分别采用了如下解决方案

  1. 针对湖南移动BOSS SYSTEM系统出现的性能问题,根据湖南移动BOSS SYSTEM系统的实际应用, 借助ESS Expert和Precise等性能监测工具软件,对主机系统和存储进行了监控,调整和优化,同时对Oracle数据库和应用系统提出调优建议。

  项目分为以下几个阶段:

  一般的调优策略如下:

  在湖南移动的调优中,在数据库的设计和应用设计不做更改的前提下,首先,对IBM存储系统和主机系统作深入细致的参数和配置调整。同时,在湖南移动计费中心技术人员的全力配合下,对ESS存储系统上的数据分布作了大规模的调整,并且通过Precise软件对Oracle数据库性能参数的监控,定位对系统 CPU, I/O等资源消耗严重的瓶颈,对Oracle数据库和应用系统提出性能调优建议。

  2.针对应用的性能状况,修改Oracle的性能参数。

  cursor_sharing的值从exact改为force, 减少internal lock wait.

  spin_count的值从2000调整到5000。

  3.调整数据在ESS上的分布。

  首先将数据平均地分布在两个cluster上,之后将数据分布在尽可能多的通道上。

  由于整个数据容量有约2120GB,整个数据的迁移需要几十个小时的时间,而在生产系统上是不允许有很长的停机时间进行数据迁移。

  根据多个方案的论证对比,决定采用逻辑卷镜像的方案实施数据迁移。具体的步骤是先将所有的逻辑卷在目的的硬盘上建立镜像、同步数据、再将原硬盘上的镜像部分删除。整个数据迁移工作全部在系统的后台进行,共进行了60个小时,完成所有数据迁移。

  4.对操作系统内核参数作出调整

  5.检查资源消耗最大语句的逻辑设计。

  建立合适的分区索引

  将排名靠前语句的表数据与索引分别存储。

  提高资源消耗靠前语句的并行度。

  Oracle 的参数cursor_sharing设为force减少internal lock wait

  调整Latch的数量(如DB_BLOCK_LRU_LATCHES)或内存的一些参数(如SHARED_POOL_SIZE等)解决内部锁问题。

  6.由于数据存储调整后,系统I/O性能状况良好,系统和存储端的性能表现已调整至最佳,系统和存储端的性能调优工作已经完成。建议客户下一步的工作重点是解决应用系统的性能瓶颈,结合Precise对应用的监控结果,检查应用的逻辑设计,数据索引的建立和分布。协助应用开发商修改应用。

  7.调整操作系统交换空间(page space)。

  项目成功与失败的经验归纳:

在湖南移动BOSS系统的性能调优中,项目的成功经验有以下几点:

  1. 数据库前期的合理的架构设计(物理设计和逻辑设计)是整个项目成败的关键,合理的架构设计为整个项目稳定可靠高效运行打下了良好的基础,同时也起到了事半功倍的作用。在湖南移动BOSS系统中就是因为数据库在ESS物理存储的不合理分布而直接导致了系统的I/O瓶颈。

  2. 根据系统的物理资源,对数据库的配置参数和操作系统内核参数做合理的调整,保证系统物理资源(CPU,I/O,内存和网络)和逻辑资源(裸设备,文件系统等)合理的分布和应用。

  3. 要善于借助于第三方的监控软件(如:StorWatch Expert和Precise软件),这些软件的运用可以快速的定位性能瓶颈从而更快速的作出性能调整。

  4. 检查资源消耗最大SQL语句的逻辑设计,将排名靠前SQL语句的表数据与索引分别存储,建立合适的分区索引,提高资源消耗靠前SQL语句的并行度。很多性能瓶颈往往是由于“恶劣”的SQL造成的。

  5. 要有一个很好的性能调整流程和性能调整方法步骤,循序渐进,一步一步定位,逐步缩小范围,知道最后定位性能瓶颈。

  6. 要善于团队合作,在整个性能调整中,我负责软件调整,要和硬件调整,网络调整的技术人员通力合作。

  7. 性能调整是全局的工作,涉及应用开发,中间件,数据库,操作系统,存储,网络等。需要对全局的信息架构有清晰的认识。

  总结:在湖南移动BOSS系统的性能调整中,我是以IBM技术顾问身份参与性能调整的,主要负责对Oracle数据库配置参数的调整;负责完成数据库后期的性能 监控,性能调优;负责检查资源消耗最大SQL语句的逻辑设计,将排名靠前SQL语句的表数据与索引分别存储,建立合适的分区索引,提高资源消耗靠前SQL 语句的并行度。负责在操作系统层面定位性能瓶颈(CPU,内存,I/O和网络瓶颈)并调整操作系统内核参数。负责协助开发人员对应用开发作出修改和SQL 性能调整。

中国计费网


相关链接:
3G最好计费方式是什么 2009-07-20
Amdocs:帮助运营商构建自己的应用商店 2009-07-13
3G时代让融合计费更赋使命 2009-07-13
BOSS接口监控及应急解析 2009-07-10
3G元年:惠普软件让3G体验更美好 2009-07-06