openpbs环境下GPU版NAMD的作业提交问题
来源:互联网 发布:python可以机器人 编辑:程序博客网 时间:2024/04/26 21:56
本文纯属友情帮忙的产物,在此之前关于GPU只是帮人在linux 64位环境下编译过NAMD。Torque从2.5.4版本起已经支持GPU的调度了,只不过作业调度得用pbs_ched,maui还是不支持。经过大半晚上的摸索,总算是勉强搞定此事。
先说说之前的问题,nodes结点里已经添加了gpu数的描述:gpus=6,pbsnodes也可以看到gpus=6的信息。并且,脚本提交里加了gpus=x的参数后也能调度GPU资源了,但运行之后却发现多个作业都挤在一个GPU上了,显然有问题。说一说我的解决思路吧:
1、torque的编译似乎没什么特别的,首先检查node文件(TORQUE_HOME/server_priv/nodes)的配置:
node1 np=x gpus=y
node2…
pbsnode检查一下,应该能看到关于结点的gpus=y的描述信息。具体可以参考官网文档。
2、检查作业提交后是否正确生成了$PBS_GPUFILE,这一步很关键,费了好大劲才查到相关说明,简单写个如下脚本
#PBS -S /bin/bash
#PBS -l nodes=1:ppn=2:gpus=2
echo $PBS_GPUFILE
如正确则应由如下的输出
node1-gpu1
node1-gpu0
表示作业分配到了node1的gpu 0和gpu 1$PBS_GPUFILE一般在/var/spool/torque/aux下放着。
3、第三步,就是怎么用$PBS_GPUFILE内容生成NAMD运行命令的+device参数值,在提交脚本里加入如下语句:
for i in `sed ‘s/node1-gpu//’ $PBS_GPUFILE`;do device=$device$i”,”;done
一个完整的NAMD提交脚本可以写成如下形式:
#PBS -S /bin/bash
#PBS -l nodes=1:ppn=2:gpus=1
for i in `sed ‘s/node1-gpu//’ $PBS_GPUFILE`;do device=$device$i”,”;done
cd /opt/NAMD
/opt/NAMD/charmrun ++local +p2 /opt/NAMD/namd2 +idlepoll +devices $device/path/to/namd-config-file
大概解释一下,+p2对应着ppn=2,而$device的值形如“0,1,”,即将分配给作业的gpu编号用逗号分隔开来,作为+device选项的值。由此就正确的设置了NAMD对GPU的使用。
4、ok了,你可以多提交几个作业,然后用nvidia-smi -a命令查看所有gpu device的使用情况,看跟实际分配情况是否一致。
最后说一句,网上实在没有找到好的解决办法,我仔细测试过此法针对但结点的调度是好使的。多结点应该就没戏了。
转载请注明: 转载自Wandering Words
本文链接: http://c-living.mobi/archives/442
- openpbs环境下GPU版NAMD的作业提交问题
- Linux下安装OpenPBS作业管理系统
- 多GPU环境下使用caffe遇到的问题
- ubuntu 下GPU版的keras的环境搭建
- torque (以前的 OpenPBS) 安装
- Nova环境下的GPU集成
- django 在shell环境下不自动提交的问题
- flink 的datastream的作业提交问题
- 解决作业提交无法复制的问题
- windows下的theano以及GPU加速环境的搭建
- Windows8-64bit环境下Theano的GPU配置
- VMWARE虚拟化环境下对GPU的配置说明
- Ubuntu16下的ThensorFlow环境配置(GPU加速)
- Ubuntu环境下安装GPU版本的caffe
- windows环境下TensorFlow-gpu版本的安装
- Win10_64位下搭建TensorFlow-GPU版本的环境
- SGE作业的提交
- window下eclipse提交hadoop作业遇到的坑
- 常用命令汇集
- MySQL存储过程详解 mysql 存储过程
- CSDN全国巡讲——广东药学院站
- 求子数组的最大和
- 1041 竞赛游戏
- openpbs环境下GPU版NAMD的作业提交问题
- ibatis 2.3 调用Oracle Function 返回字符串实例
- JavaScript获取和设置CheckBox状态
- CSDN问答频道声望排行榜出炉,4月起上榜有礼
- 百万级SQL优化总结
- 写给新入IT的新人们:多看、多问、多写
- 函数指针的应用(二)
- dos 基本命令
- hdu1010 深搜