产品--自主研发

应对大量计算,提高计算性能,降低计算能耗,简便部署,统一管理

RJMS作业调度管理系统

产品概述

RJMS作业调度管理系统负责计算资源统一管理和作业调度,帮助用户合理使用计算资源。它提供灵活多样的调度策略、稳定可靠的计算服务、简洁易用的可视化界面,不仅支持大规模异构集群的作业调度,还可以对多个集群实现统一管理。RJMS可大幅度提高集群的计算性能,加速数据分析处理进程。

产品优势

  • 稳定
    RJMS已运行18年
  • 强大
    可管理超过20,000 CPU 核心的超大规模计算集群
  • 灵活
    策略实时调整
  • 专业
    资深研发团队

业务挑战

一个大型计算集群系统需要支持上千个用户同时操作,以及上万个作业同时运行。这对计算集群的稳定性、可靠性提出极其苛刻的要求。

RJMS根据集群运行情况实时调整作业调度策略,并对每个作业进程实时监视,保证集群高效稳定运行。RJMS提供基于Web页面的系统管理图形界面,帮助管理员随时随地了解运行状态,修改调度策略,增强了计算集群的可用性。RJMS提供细粒度的队列管理功能,将异构资源划分成队列实现资源管理调度,保证系统对不同体系结构资源的支持性。

产品功能

· 调度策略

提供多个队列的个性化配置,支持GPU计算加速调度

支持“多级抢占”、“预约回填”、“动态作业优先级”、“节点独占”等多种调度策略

· 计算服务

计算节点自检功能,实时故障点排队。

对作业异常行为快速响应并提供多种容错处理方案。

· 统一管理

支持多个集群系统统一管理

支持异构集群统一管理

· 可视化界面

提供脚本、命令行、Web界面等多种用户交互方式。

提供方便的工具对用户、队列、节点等属性和权限进行设置。

提供丰富的作业运行统计分析报表。

应用场景

动漫渲染 图像处理、高清视频、三维渲染
石油勘探 地震资料处理、地震资料解释、油藏模拟
气象环境 中尺度、中长期预报、海洋、环境预报
生命科学 序列对比、分子对接、份子动力学
物理化学 量子力学、分子力学、蒙特卡罗分析
CAE仿真 结构分析、流体分析、电磁场分析