PBS Pro
大约 2 分钟
什么是 PBS Pro?
PBS Professional® 软件优化高性能计算 (HPC) 环境(集群、云和超级计算机)中的作业调度和工作负载管理,从而提高系统效率和人员生产力。 PBS Pro™ 由 HPC 人员为 HPC 人员构建,具有快速、可扩展、安全和弹性的特点,支持所有现代基础设施、中间件和应用程序。
- 可扩展性:支持数百万核,具有快速的作业调度和最小的延迟; 测试超过 50,000 个节点
- 策略驱动的调度:通过平衡工作周转时间和利用率与最佳工作安排来满足独特的站点目标和 SLA
- 弹性:包括无单点故障的自动故障转移架构——作业永远不会丢失,作业在发生故障时继续运行
- 灵活的插件框架:通过增强的可见性和可扩展性简化管理; 定制实现以满足复杂的需求 健康检查:通过全面的健康检查框架监控并自动缓解故障
- 被 HPC Wire 读者投票选为第一名的 HPC 软件,并在全球数千个私营部门和公共部门的站点上经过 20 多年的验证
PBS Pro架构和组件
集群环境中的PBS Pro架构图及组件:
Server(pbs_server)
server的主要功能包括:接收作业提交申请,创建作业,修改作业,系统崩溃时保护作业状态,运行作业。Job Executor(pbs_mon)
在计算节点上pbs_mon接收来自server分配的作业并将其运行起来,并将作业的输出传回给用户。pbs_mon会在计算节点上以用户身份开启一个登陆shell。Scheduler(pbs_sched)
pbs_sched控制作业和资源的全局策略。pbs_sched与pbs_mon通讯查询资源状态,与pbs_server通讯控制作业分发策略。Communication deamon(pbs_mon)
pbs_mon处理pbs各进程直接的通讯Command
pbs提供命令行接口用来提交,查看,监控,修改和删除作业。运行pbs命令的节点不需运行上述的pbs任何角色。pbs命令分为三类:user commands, operator commands, manager commands. 后两者需要特殊权限运行。
Powered by Waline v2.14.7