集群监控管理套件中的自动化运维管理系统是一个可用于数据中心自动化管理的解决方案。软件基于C/S架构,整合了Apache、Ruby、Java、Augeas、Puppet、Factor、Foreman、Git、tftp、Pulp等当今众多最流行开源软件,以Ruby语言为基础,并使用了Java、Python语言的高级功能,开发实现了对数据中心高性能计算系统中计算设备的智能化安装和部署。
主要特点:
1) 大批量计算机操作系统快速高效的自动安装、配置和统一管理;
2) 大批量计算机应用软件的自动安装,配置和统一管理以及版本管理;
3) 对安装管理的所有计算设备运行状态监视,资源使用统计;
4) 可以实现高性能计算集群规模的快速扩容;
5) 降低系统的故障率。
自动化运维管理系统的主要功能:
· 系统概况展示
· 主机和主机组管理
· 操作系统管理
· 功能模块管理
· 配置参数管理
· 安装源管理
· 网络管理
· 用户管理
· 系统资源和系统状态监控
· 日志记录与管理
功能及用户界面:
系统资源和系态监控提供计算机系统资源使用和状态页面,帮助管理员了解整个数据中心的软硬件资源以及系统运维的健康状态。下图可以监视操作系统的版本、系统的架构、系统分布式环境、CPU的数量、硬件的统计、主机组分布等信息。通过这些信息可以快速掌握系统的运行情况。