服务器 频道

Win2008 HPC群集之作业失败疑难解答

  【IT168 专稿】在Windows HPC Server 2008群集中,作业和任务可能会因多种原因失败。

  作业失败疑难解答

  检查作业错误消息

  在"导航窗格"中的"我的作业"下,单击"失败"。

  双击一项作业(或右键单击一项作业,然后单击"查看作业")可查看作业详细信息。

  在"查看作业"对话框中,单击"结果和统计信息"。

  检查"错误消息"字段以获取有关作业失败原因的信息。

  作业失败的常见原因

  作业中一项或多项任务失败。这是最常见的作业失败原因。这表明一项或多项任务无法运行或未能成功完成。查看任务级别错误消息以调查该类型的作业失败。在"查看作业"对话框中,单击"查看失败的任务"。

  无法联系分配到作业的节点。对于因无法联系节点而失败的作业,系统会自动重试特定的次数,但如果问题继续存在,作业最终会失败。如果收到此错误消息,请联系您的群集管理员。

  作业的运行时间已过期。作业计划程序服务会取消到达运行时间界限的作业。如果可能,请修改作业的运行时间,然后对作业进行重新排队。详细信息,请参阅修改作业 和对作业或任务进行重新排队。

  无法在一个已分配节点上启动作业。此类型失败的最常见原因是与作业关联的用户名或密码无效。可以使用 job modify 命令行命令更新附加到作业的凭据,然后尝试进行重新排队。有关使用命令行命令的详细信息,请参阅 http://go.microsoft.com/fwlink/?LinkID=120724.

0
相关文章