监控管理

当前位置:首 页 >> 系统集成 >> 监控管理

数据中心设备监控管理方案

1.功能概述

监控软件系统能够采集网络设备、存储设备、操作系统、数据库的指标数据,并可以根据客户设置的告警规则对性能、日志、状态,通过不同的告警方式自动发出告警,同时会帮助客户采集IT资源的运行状态数据,载入数据中心以支持数据分析

监控软件的特性如下:

     对网络、存储、操作系统、数据库、机房环境等实时监控

     提供灵活定制的告警规则设置

     实时的性能监控页面,提供图形化的趋势分析,如趋势图,饼状图和曲线图

     支持的标准SNMP协议

     支持早期预警设置

     多渠道告警方式,如电子邮件、短信等

     通过电子邮件定期给管理员发送PDF报表(报表类型按照时间分为日报、周报、月报、年报)

     提供历史的性能数据查询分析

     所用到的组件均基于Java Open Source

 

2.方案优势与客户收益

通过监控软件在其关键业务主机上面的推广,将会实现对PC Server和网络的统一监管平台,客户能在第一时间得到被监控机器的运行状态,为及时解决问题,保证生产系统的安全,平稳运行提供保障。

通过运维支持服务监控软件监控平台和监控体系管理,将可以:

        2.1实时监控网络的状态、设备的状态、存储的状态、操作系统的状态

通过监控软件可以实时监控网络的流量、网络的性能、网络的运行状态等指标,并对产生的告警及时通知管理员,做到管理员及时排除故障,保证网络通畅

       2.2对网络设备做综合配置

管理员可以通过监控软件,对网络设备做参数配置,并实时启用,已保证网络流量及状态的正常

       2.3对机房整理环境的检测及告警

可以对机房的空调、UPS、机柜等设备的运行状态及时监控、并对产生的问题及时告警,以保证管理员及时修复问题

       2.4简化了系统维护人员的日常操作的工作量,降低了系统维护的复杂度

通过对IT基础设施纳入监控软件监控范围,用户可通过监控软件管理界面,真正监管日常设备运行,接收操作系统级别的预警及报警、及时解决问题。使IT监管工作建立在统一科学的管理标准之上、扩大IT监管人员的支持范围(例如一名系统管理员可管理更多服务器),从而大大提高IT监管能力。

      2.5保证了对各类系统故障的及时发现和快速响应

依靠监控软件管理软件,将拥有一套自动化基础设施监管系统,实现基础设施预警、报警、响应等全程全天候自动化监管功能,避免人为因素造成的失误和风险,有助于减少IT员工在维护活动上花费的时间,从而大大提高工作效率。

2.6数据库数据的定期转储和系统的备份计划的实施,保证了监控软件具备较高的可用性

监控软件对监控过程中采集的性能数据,日志数据和报表有定期备份和清理机制:

l  备份机制和清理机制保证了过期数据能被定期转存和清理;

l  IT运行服务器环境不会产生堆积文件和消耗硬盘资源的情况,报表的存档的功能能保证历史数据根据需要进行归档。

3逻辑架构

它由采集服务,告警服务,报表服务,UI服务,健康自检服务组成,具体架构如下图所示:

 

 

l  采集服务:负责采集每个节点的关键指标,可以采集网络、OS、数据库、存储、交换机等设备

l  告警服务:根据采集上来的关键性能指标与预定义的阀值比较,并产生告警,将告警按多种取到发送给管理员

l  报表服务:按系统配置定期产生报表

l  UI服务:UI界面,管理员在UI界面上可以监控系统状况,并做设置

 

健康自检服务:及时监控SIM+服务的运行状态,对于出现问题的服务,及时通知管理员

功能如下图所示: