服务器 频道

Win2008 HPC群集之作业管理器概述

  【IT168 专稿】Windows HPC Server 2008 为运行、管理和开发并行计算应用程序提供了一个集成的应用程序平台。HPC 作业管理器是将作业提交至群集的主要界面。

  使用 HPC 作业管理器,可以从一个位置提交、监视和管理所有计算作业。

  注:还可以使用"命令提示"窗口、HPC PowerShell 或 HPC 基本配置文件 Web 服务接口提交、管理和查看群集上的作业。

  HPC 作业的基本术语

术语

定义

作业

提交至作业计划程序服务的资源请求,其中包含一项或多项任务。

任务

执行用户应用程序。任务不能独立于作业运行。但是,一项作业可以仅包含一项任务。

每项作业都有一组必须在作业完成前运行的任务。要让任务按特定顺序运行,必须定义任务之间的相关性。

作业模板

由群集管理员创建的用于定义应用程序作业参数的自定义提交策略。作业模板可提供默认值,并限定作业属性的值,以帮助用户创建满足其需要并符合资源分配策略的作业。

作业或任务说明文件

用户命名的包含作业规范或任务规范的 XML 文件。通过该文件,您可以将作业或任务保留为将来提交的模式。从说明文件创建新作业或任务时,可以修改任何属性,然后再提交。

队列

已提交至作业计划程序服务,要由群集运行的作业列表。队列中作业的运行顺序由一组计划策略决定。群集管理员会配置计划策略。

作业计划程序服务

一种负责对作业和任务进行排队、分配资源、为计算节点分派任务并监视作业、任务和节点的状态的服务。

  HPC 群集资源的基本术语

术语

定义

群集

HPC 群集的顶层组织单元,它由一组节点、一个队列以及多项作业组成。

节点

群集中命名的单个主机。

节点组

节点的集合。三个默认组是头节点、计算节点和 Windows Communication Foundation (WCF) 代理节点。群集管理员可以创建其他组并为一个或多个组分配节点。

内核

节点上的单个 CPU。例如,双内核处理器通常被视为两个内核。

套接字

就作业计划程序服务而言,套接字是一组具有专门内存总线的处理器。这也称为非统一内存访问 (NUMA) 节点。

0
相关文章