1.实验系统ubuntu14.04。更新系统软件,防止相关软件版本过低
|
|
2.从官网下载Torque,在这里为Torque 5.1.1。
3.解压文件
|
|
4.运行configure,可加prefix指定Torque命令安装位置,也可不加,不加参数命令默认装在/usr/local/bin和/usr/local/sbin下。利用configure可以检测依赖软件,按照提示安装这些软件。
|
|
5.编译安装
|
|
6.生成子节点安装包,mom和clients为需要拷贝的文件。需要安装ssh,ubuntu默认安装openssh-client,所以需要手动再安装openssh-server,让其他计算机登陆。
|
|
7.在子节点上安装,mom和clients。
|
|
8.配置主节
- 将/usr/local/torque/bin和/usr/local/torque/sbin添加进环境变量,这里我将其添加入.bashrc文件。
|
|
- 添加主节点名字:
|
|
- 添加子节点,np为节点cpu核个数
vi /var/spool/torque/server_priv/nodes
子节点的名字为计算机名,而非用户名。每次添加节点需要重启pbs_sever。添加如下内容(也可以先在子节点启动mom,在主节点启动server,然后用命令qmgr -c 'create node ubuntu np=4'
进行添加节点):
- 启动
|
|
9.配置子节点,同样需要添加环境变量。
修改config
使用make packages 命令生成mom安装于子节点的,无需进行这一步。1234vi /var/spool/torque/mom_priv/config添加:pbsserver 主节点名称logevent 255启动:
|
|
10.注意!因为配置文件中使用了主节点名称和子节点名称,所以主、从节点都需要修改
|
|
11.检查运行情况
保证在server上运行trqauthd
、pbs_server
、pbs_sched
这三个程序。
保证在子节点上运行pbs_mom
。
12.常用命令pbsnodes
: 子节点信息。qterm
: 结束pbs_server。qsub
: 提交job。qstat
: job运行信息。
13.测试:
注意!在提交Job时,需要主节点和子节点为相同的用户名,同时保证操作的文件目录也相同。