Moab 5.2.0+Torque 2.2.1/pbs集群作业可视化管理系统部署试验

来源:互联网 发布:淘宝百度云盘资源暗号 编辑:程序博客网 时间:2024/05/16 15:30


Moab 5.2.0+Torque 2.2.1/pbs
集群作业可视化管理系统部署试验

1、介绍
全称:Moab Cluster Suite
官方网站http://www.clusterresources.com/
商业软件,其中部分部件开源。它可以接管pbs等作业管理系统的任务调度与分发,以及可视化功能查看。
三个主要部件:
Workload Manager
实现与多种集群作业调度系统的无缝连接(包括LoadLeveler, TORQUE/OpenPBS, PBSPro, SGE 5.3, SSS/Bamboo, SLURM/Wiki, LSF, Condor, BProc/ClubMask)
Cluster Manager
基于JAVA的图形化控制界面
Access Portal
基于web的图形化控制界面
2、试验环境
硬件:
实验室DELL2950集群,用了四个节点Node001, Node002, Node004, Node005,其中Node002为server,也参与计算工作
系统:
Node001、002、004为rhel5.1,Node005为CentOS4.6
MPI环境:MPICH1+GCC
程序:Linpack、cpi
3、安装注意
3.1 采用localhost做为127.0.0.1 主机名 别名用Node002
/var/spool/torque/server_name 与主机名对应
3.2 server设置/var/spool/torque/server_pris/nodes
node001 np=8
node002 np=8
node004 np=8
node005 np=8
3.3 client设置/var/spool/torque/mom_pris/config
       node002
4、小结
moab5.2.0+torque2.2.1/pbs的部署方案配合ganglia等集群监控系统,对于高效利用与管理大型集群有一定帮助。

附图:

登陆画面

本地管理界面


远程管理界面

发起作业界面