EasyMonitor

成功案例
  • 七天连锁酒店(www.7daysinn.cn)
  • 广州移动内部系统监控
  • 试手机网(www.shishouji.com)
  • 广州电信网上营业厅
  • 满堂红(www.mytophome.com)
  • 广东移动12580业务关联分析
  • 广州博览会wap平台

EasyMonitor助力广州移动确保系统可靠性服务

项目背景

广州移动是广州地区规模最大的通信运营商,其业务经营范围涉及移动语音基本业务、IP电话、移动数据业务和多媒体业务,并具有计算机互联网国际联网单位经营权。随着业务的不断发展,广州移动内部支撑平台也越来越多,这上百个支撑平台服务于不同的部门,不同的业务,数量众多,功能不一,且部分平台还是由第三方公司开发的,如何整合监控管理这些平台成为广州移动IT部门的一大挑战。

项目实施和结果

项目开始之初,EasyMonitor项目小组就和广州移动IT部门进行了充分的沟通,明确了项目的最终目标就是:“一站式监控管理企业内部所有支撑平台,时刻保证所有平台的健康运行。”在这一前提下EasyMonitor项目小组迅速的投入了工作,先是对广州移动内部支撑平台进行了调研,然后开始了项目实施,快速实现了监控管理的功能,而广州移动IT部门工作人员则可以在EasyMonitor管理平台上一站式管理企业内部所有支撑平台。

EasyMonitor界面-网站监控引擎-botwave.com
图一:EasyMonitor界面

本次通过部署EasyMonitor实现了以下功能:

(1)整体使用状况监控:通过这功能可以在一个页面中看到所有支撑平台的运行情况:包括每个模块或者页面的访问量、出错比例,在线用户数,各个用户组的访问排行,各个页面的点击云图,记录每个用户的访问轨迹等等。
  EasyMonitor的模块化分析可以拆分体现系统中各个模块使用情况,以助IT部门保证系统中负荷最高、用户关注度最大的的模块能良好运转。

模块监控-网站监控引擎-botwave.com
图二:模块监控

(2)vip用户监控:这一功能着重于关注vip用户的访问体验,在页面响应慢或者崩溃的情况下及时通知IT部门作出调整,以保证vip用户的访问速度。

(3)出错监控:记录系统的出错情况,并可以具体到哪一个用户在哪个时间点在哪个模块哪个页面上出现的错误,供IT部门整改。

(4)性能监控:记录所有系统的响应速度,并可以根据使用具体情况设置不同的用户满意度公式,以便根据不同用户组关注重点做出调整。

  如何提升一个系统的使用效率和用户感受,出错状况和访问时间(性能情况)是最为重要的2个指标。在以往的情况下,IT部门对这两个指标的监控往往只能依靠用户的报障,而绝大多数用户遇到异常状况并不会反馈。现在,依靠EasyMonitor的出错监控和性能监控能让系统的每一个异常情况都无所遁形,以便IT部门针对频发的、错误量大的异常情况加以整改,而不是期望优化系统但却一脸茫然。
  EasyMonitor出错分析可以根据不同类型的错误和不同页面的错误来分别展现系统中所有的出错情况,让每个类型或者页面错误发生的数量、周期、频率、影响程度都一目了然。

出错类别-网站监控引擎-botwave.com
图三:出错类别

页面出错-网站监控引擎-botwave.com
图四:页面出错

  一个系统中,因为访问量、页面属性、网络服务器质量等等因素的影响,使得各个页面的响应速度不尽相同,如何找出那些使用频率高、对用户影响大但是性能异常的页面?EasyMonitor页面性能生长曲线正是对所有页面的用户访问加以记录,并以生长曲线的形式呈现出页面性能异常状况。对于异常情况严重的页面IT部门需要着重关注。

页面性能-网站监控引擎-botwave.com
图五:页面性能

(5)预警监测:可以根据使用情况设置报警规则,在系统达到临界点时及时通知工作人员。

(6)投资回报分析:根据不同用户组的访问量和关注重点,给出各个页面的投资建议。

  通过部署EasyMonitor,使得广州移动IT部门面对众多支撑系统不再盲目,可以实时知道各个系统的运转状况和需要改进的地方,让工作变得更加有效率和针对性,亦为运营提供了极大帮助。