命令,配置和进程

Mr.Haoz大约 2 分钟

注意

本文档适用于 Slurm 版本 22.05。 其他版本的 Slurm 的文档随代码一起分发

命令

命令说明
sacct显示 Slurm 作业记帐日志或 Slurm 数据库中所有作业和作业步骤的记帐数据。
sacctmgr用于查看和修改 Slurm 帐户信息。
salloc获取一个 Slurm 作业分配(一组节点),执行一个命令,然后在命令完成时释放分配。
sattach附加到 Slurm 作业步骤。
sbatch向 Slurm 提交批处理脚本。
sbcast将文件传输到分配给 Slurm 作业的节点。
scancel用于指示受 Slurm 控制的作业或作业步骤。
scontrol查看或修改 Slurm 配置和状态。
scrontab管理 Slurm crontab 文件。
sdiag调度诊断工具。
sh5utilacct_gather_profile 插件的合并实用程序。
sinfo查看有关 Slurm 节点和分区的信息。
slurmSlurm 系统概述。
sprio查看构成作业调度优先级的因素。
squeue查看有关位于 Slurm 调度队列中的作业的信息。
sreport从 slurm 会计数据生成报告。
srun运行并行作业。
sshare用于列出集群的关联份额的工具。
sstat显示正在运行的作业/步骤的状态信息。
strigger用于设置、获取或清除 Slurm 触发信息。
sview用于查看和修改 Slurm 状态的图形用户界面。

配置文件

文件说明
acct_gather.confacct_gather 插件的 Slurm 配置文件。
burst_buffer.confSlurm 突发缓冲区配置。
cgroup.conf用于 cgroup 支持的 Slurm 配置文件。
ext_sensors.conf用于外部传感器支持的 Slurm 配置文件。
gres.conf用于通用资源管理的 Slurm 配置文件。
helpers.confnode_features/helpers 插件的 Slurm 配置文件。
job_container.conf用于配置 tmpfs 作业容器插件的 Slurm 配置文件。
knl.conf用于 Intel Knights Landing 管理的 Slurm 配置文件。
nonstop.conf用于故障管理的 Slurm 配置文件。
oci.confOCI 容器的 Slurm 配置文件。
slurm.confSlurm 配置文件。
slurmdbd.confSlurm 数据库守护程序 (SlurmDBD) 配置文件。
topology.conf用于定义网络拓扑的 Slurm 配置文件。

守护进程和其他

进程说明
slurmctldSlurm 的中央管理守护进程。
slurmdSlurm 的计算节点守护进程。
slurmdbdSlurm 数据库守护进程。
slurmrestdSlurm REST API 守护进程。
slurmstepdSlurm 的作业步骤管理器。
SPANK用于节点和作业 (K) 控制的 Slurm 插件架构。
评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v2.14.7

回到顶部