Cluster 安装

来源:互联网 发布:上海黄浦行知进修学院 编辑:程序博客网 时间:2024/04/28 10:43

由于我们已经配置好了Server 和 Node1

我们现在增加一台服务器,取名字为Node2

你需要使用安装盘,安装网卡驱动。我们的主版为Super_micro X7DVL-E 网卡为Intel得千兆网卡。找到安装盘路径

make install

rmmod e1000

insmod /lib/modules/**/kernel/drivers/net/e1000/e1000.ko

modprobe e1000

编辑/ect/modprobe.config  增加

alias eth0 e1000
alias eth1 e1000
然后设置网络

ifconfig eth0 192.168.1.x

设置成功,你可以用ping内部其他接点来确定网络正常。

更改/etc/hosts/

192.168.1.254 server

192.168.1.1 node1

192.168.1.x node2

增加文件/etc/host.conf

multi on

更改文件/etc/sysconfig/network

HOSTNAME=node2.cluster
NISDOMAIN=cluster

并修改server 和 node1得/etc/hosts文件,增加 192.168.1.x node2

你需要确认你的node2 机器是否安装NFS. 如果没安装,则安装 nfs-utils-0.3.3-5.i386.rpm

mount -t nfs -o bg,hard,intr server.cluster:/home /home

mount -t nfs -o bg,hard,intr server.cluster:/opt /opt

mount -t nfs -o bg,hard,intr server.cluster:/usr/local /usr/local

然后启动NIS 客户端服务

domainname cluster

增加 /etc/yp.conf

  domain cluster server 192.168.1.254

你需要修改node2 中 /etc/passwd  增加所有用户。这样所有的用户可通过ssh和node2 连接。

并加上"+::::::"

增加文件/etc/nsswitch.conf

passwd: nis files
shadow: nis files
group:  nis files
hosts:  nis files dns

你只需要把server路径下/var/spool/torque/  拷贝到 nod2 /var/spool/  下面

然后运行/usr/local/sbin/pbs_mom

然后更改server路径下 /var/spool/torque/server_priv/nodes 文件 添加

node2.cluster np=8

然后 运行

qmgr -c "set queue batch resources_max.ncpus=14 (为你的所有接点的cpu总数)"

然后重现启动 pbs 服务  运行 

qterm

/usr/local/sbin/pbs_server

为了运行并行任务,你首先必须安装mpi,我们选择MPICH_2 安装后你可以测试,首先运行mpd,然后运行mpirun 如果你需要测试多接点,你必须运行mpdboot  然后再运行mpirun来测试。

但是由于我们现在要使用PBS中 mom守护进程来运行MPI.所以你需要安装MPI_exec。我们安装版本为mpiexec-0.82 而Torque得版本为最新。如果不是最新,你必须安装patch.

安装MPIexec必须注意由于我们使用MPICH_2。

./configure --with-default-comm=pmi

这样你就可以使用MPIexec来运行你的并行程序了,而不需要启动MPD守护进程。

原创粉丝点击