产品--自主研发
应对大量计算,提高计算性能,降低计算能耗,简便部署,统一管理
RJMS作业调度管理系统
产品概述
RJMS作业调度管理系统负责计算资源统一管理和作业调度,帮助用户合理使用计算资源。它提供灵活多样的调度策略、稳定可靠的计算服务、简洁易用的可视化界面,不仅支持大规模异构集群的作业调度,还可以对多个集群实现统一管理。RJMS可大幅度提高集群的计算性能,加速数据分析处理进程。
产品优势
-
稳定
RJMS已运行18年 -
强大
可管理超过20,000 CPU 核心的超大规模计算集群 -
灵活
策略实时调整 -
专业
资深研发团队
业务挑战
一个大型计算集群系统需要支持上千个用户同时操作,以及上万个作业同时运行。这对计算集群的稳定性、可靠性提出极其苛刻的要求。
RJMS根据集群运行情况实时调整作业调度策略,并对每个作业进程实时监视,保证集群高效稳定运行。RJMS提供基于Web页面的系统管理图形界面,帮助管理员随时随地了解运行状态,修改调度策略,增强了计算集群的可用性。RJMS提供细粒度的队列管理功能,将异构资源划分成队列实现资源管理调度,保证系统对不同体系结构资源的支持性。
产品功能
· 调度策略
提供多个队列的个性化配置,支持GPU计算加速调度
支持“多级抢占”、“预约回填”、“动态作业优先级”、“节点独占”等多种调度策略
· 计算服务
计算节点自检功能,实时故障点排队。
对作业异常行为快速响应并提供多种容错处理方案。
· 统一管理
支持多个集群系统统一管理
支持异构集群统一管理
· 可视化界面
提供脚本、命令行、Web界面等多种用户交互方式。
提供方便的工具对用户、队列、节点等属性和权限进行设置。
提供丰富的作业运行统计分析报表。
应用场景
动漫渲染 | 图像处理、高清视频、三维渲染 |
石油勘探 | 地震资料处理、地震资料解释、油藏模拟 |
气象环境 | 中尺度、中长期预报、海洋、环境预报 |
生命科学 | 序列对比、分子对接、份子动力学 |
物理化学 | 量子力学、分子力学、蒙特卡罗分析 |
CAE仿真 | 结构分析、流体分析、电磁场分析 |