3、了解作业和任务状态
在 Windows HPC Server 2008 中,作业和任务有几乎相同的生命周期状态(任务没有"外部验证"状态)。主要的生命周期状态包括"正在配置"、"已排队"、"正在运行"、"已完成"、"失败"和"已取消"。作业和任务也经过短暂的过渡状态。
HPC 作业计划程序服务可以对作业和任务进行排队、分配资源、为计算节点分派任务,以及监视作业、任务和节点的状态。
状态 | 定义 |
正在配置 | 作业或任务位于系统中,但还未提交到队列。 |
已提交 | 作业或任务已提交且正在等待验证,然后才能进行排队。 |
外部验证 | 作业正在通过群集管理员定义的提交筛选器应用程序运行这些筛选器的条件示例包括: · 项目验证:此条件用于验证项目名称是否为有效项目的名称,且用户是否属于该项目的成员。 · 使用时间:此条件用于确保没有超出用户的时间分配。与强制性策略不同,该筛选器将作业限制到用户对所有可能作业所拥有的总时间分配内。 如果作业通过了外部验证,则其状态会变为“正在验证”。如果作业未通过外部验证,您会收到错误消息,且作业状态会变为“失败”。 |
正在验证 | HPC 作业计划程序服务正在验证作业或任务。在验证期间,HPC 作业计划程序服务会确认权限、为您未指定的所有属性应用默认设置,以及对照约束验证每个属性。默认设置和约束由作业模板定义。HPC 作业计划程序服务还会确认作业属性是否涵盖所有任务属性(例如,没有任何任务的运行时间长于作业的运行时间)。 如果作业通过验证,则其状态会变为“已排队”。如果作业未通过验证,您会收到错误消息,且作业状态会变为“失败”。 |
已排队 | 作业或任务通过了验证,且正在等待安排和激活(运行)。 |
正在运行 | 作业或任务正在一个或多个节点上运行。 |
即将完成 | 作业或任务已完成,正在进行作业或任务清除。 |
已完成 | 作业或任务已成功完成。 |
失败 | 作业或任务未能完成。 |
正在取消 | 作业或任务已取消,正在进行清除。 |
已取消 | 作业或任务已取消。作业所有者和群集管理员可以手动取消作业或任务。如果任务超过其运行时间或被取代,HPC 作业计划程序服务会取消这些任务。通常,HPC 作业计划程序服务会自动对被取代的作业进行重新排队。 |