命令,配置和进程
大约 2 分钟
注意
本文档适用于 Slurm 版本 22.05。 其他版本的 Slurm 的文档随代码一起分发
命令
命令 | 说明 |
---|---|
sacct | 显示 Slurm 作业记帐日志或 Slurm 数据库中所有作业和作业步骤的记帐数据。 |
sacctmgr | 用于查看和修改 Slurm 帐户信息。 |
salloc | 获取一个 Slurm 作业分配(一组节点),执行一个命令,然后在命令完成时释放分配。 |
sattach | 附加到 Slurm 作业步骤。 |
sbatch | 向 Slurm 提交批处理脚本。 |
sbcast | 将文件传输到分配给 Slurm 作业的节点。 |
scancel | 用于指示受 Slurm 控制的作业或作业步骤。 |
scontrol | 查看或修改 Slurm 配置和状态。 |
scrontab | 管理 Slurm crontab 文件。 |
sdiag | 调度诊断工具。 |
sh5util | acct_gather_profile 插件的合并实用程序。 |
sinfo | 查看有关 Slurm 节点和分区的信息。 |
slurm | Slurm 系统概述。 |
sprio | 查看构成作业调度优先级的因素。 |
squeue | 查看有关位于 Slurm 调度队列中的作业的信息。 |
sreport | 从 slurm 会计数据生成报告。 |
srun | 运行并行作业。 |
sshare | 用于列出集群的关联份额的工具。 |
sstat | 显示正在运行的作业/步骤的状态信息。 |
strigger | 用于设置、获取或清除 Slurm 触发信息。 |
sview | 用于查看和修改 Slurm 状态的图形用户界面。 |
配置文件
文件 | 说明 |
---|---|
acct_gather.conf | acct_gather 插件的 Slurm 配置文件。 |
burst_buffer.conf | Slurm 突发缓冲区配置。 |
cgroup.conf | 用于 cgroup 支持的 Slurm 配置文件。 |
ext_sensors.conf | 用于外部传感器支持的 Slurm 配置文件。 |
gres.conf | 用于通用资源管理的 Slurm 配置文件。 |
helpers.conf | node_features/helpers 插件的 Slurm 配置文件。 |
job_container.conf | 用于配置 tmpfs 作业容器插件的 Slurm 配置文件。 |
knl.conf | 用于 Intel Knights Landing 管理的 Slurm 配置文件。 |
nonstop.conf | 用于故障管理的 Slurm 配置文件。 |
oci.conf | OCI 容器的 Slurm 配置文件。 |
slurm.conf | Slurm 配置文件。 |
slurmdbd.conf | Slurm 数据库守护程序 (SlurmDBD) 配置文件。 |
topology.conf | 用于定义网络拓扑的 Slurm 配置文件。 |
守护进程和其他
进程 | 说明 |
---|---|
slurmctld | Slurm 的中央管理守护进程。 |
slurmd | Slurm 的计算节点守护进程。 |
slurmdbd | Slurm 数据库守护进程。 |
slurmrestd | Slurm REST API 守护进程。 |
slurmstepd | Slurm 的作业步骤管理器。 |
SPANK | 用于节点和作业 (K) 控制的 Slurm 插件架构。 |
Powered by Waline v2.14.7