PBSPro集群用户使用手册
大约 2 分钟
PBSPro集群使用手册
1. 概述
PBSPro是一种常用的作业调度系统,用于管理和调度计算集群上的作业。它提供了一套命令行工具,可以方便地提交、管理和监控作业。
2. 登录集群
使用SSH协议连接到集群的登录节点:
ssh username@cluster_address
替换username
为您的用户名,cluster_address
为集群的地址或主机名。
3. 提交作业
编写一个PBS脚本文件,描述您的作业要求和执行命令。例如,创建一个名为job.pbs
的PBS脚本文件,内容如下:
#!/bin/bash
#PBS -N MyJob
#PBS -l nodes=1:ppn=8
#PBS -l walltime=1:00:00
cd $PBS_O_WORKDIR
mpirun -np 8 my_program
在PBS脚本中,使用#PBS -l
行来指定您作业所需的资源。例如,使用#PBS -l nodes=2:ppn=4
请求两个节点,每个节点使用4个处理器核心。
然后使用qsub
命令提交作业:
qsub job.pbs
作业将被提交到调度队列中等待执行。
4. 查询作业
使用qstat
命令查询您的作业状态:
qstat
该命令将显示当前用户的作业列表以及作业的状态信息。
qstat -f job_id
该命令将显示作业的详细信息。
5. 取消作业
如果需要取消正在运行或排队的作业,可以使用qdel
命令:
qdel job_id
将job_id
替换为您要取消的作业的ID。
6. 作业依赖性
如果一个作业依赖于另一个作业的完成,可以使用#PBS -W depend
行来定义依赖关系。例如,使用#PBS -W depend=afterok:job_id
等待job_id
作业成功完成后再运行。
7. 高级功能
PBSPro还提供其他高级功能,如作业数组、作业检查点和恢复等。详细信息可以参考PBSPro的官方文档和手册。
以上是一个简要的PBSPro集群使用手册,覆盖了基本的作业提交、查询和取消等操作。实际使用中,需要根据集群的具体配置和需求进一步定制和优化。建议参考PBSPro的官方文档以获取更详细的信息和指导。
Powered by Waline v2.14.7