PBSPro集群用户使用手册

Mr.Haoz大约 2 分钟

PBSPro集群使用手册

1. 概述

PBSPro是一种常用的作业调度系统,用于管理和调度计算集群上的作业。它提供了一套命令行工具,可以方便地提交、管理和监控作业。

2. 登录集群

使用SSH协议连接到集群的登录节点:

ssh username@cluster_address

替换username为您的用户名,cluster_address为集群的地址或主机名。

3. 提交作业

编写一个PBS脚本文件,描述您的作业要求和执行命令。例如,创建一个名为job.pbs的PBS脚本文件,内容如下:

#!/bin/bash
#PBS -N MyJob
#PBS -l nodes=1:ppn=8
#PBS -l walltime=1:00:00

cd $PBS_O_WORKDIR
mpirun -np 8 my_program

在PBS脚本中,使用#PBS -l行来指定您作业所需的资源。例如,使用#PBS -l nodes=2:ppn=4请求两个节点,每个节点使用4个处理器核心。

然后使用qsub命令提交作业:

qsub job.pbs

作业将被提交到调度队列中等待执行。

4. 查询作业

使用qstat命令查询您的作业状态:

qstat

该命令将显示当前用户的作业列表以及作业的状态信息。

qstat -f job_id

该命令将显示作业的详细信息。

5. 取消作业

如果需要取消正在运行或排队的作业,可以使用qdel命令:

qdel job_id

job_id替换为您要取消的作业的ID。

6. 作业依赖性

如果一个作业依赖于另一个作业的完成,可以使用#PBS -W depend行来定义依赖关系。例如,使用#PBS -W depend=afterok:job_id等待job_id作业成功完成后再运行。

7. 高级功能

PBSPro还提供其他高级功能,如作业数组、作业检查点和恢复等。详细信息可以参考PBSPro的官方文档和手册。

以上是一个简要的PBSPro集群使用手册,覆盖了基本的作业提交、查询和取消等操作。实际使用中,需要根据集群的具体配置和需求进一步定制和优化。建议参考PBSPro的官方文档以获取更详细的信息和指导。

评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v2.14.7

回到顶部