服务器 频道

Win2008 HPC群集之节点管理入门

  【IT168 专稿】在"节点管理"中,可以将节点添加到群集、监视节点状态以及对节点执行管理操作。所有群集节点都必须有关联的节点模板。

  (一)对计算节点进行分组

  节点组是计算节点的命名集合。通过创建自定义节点组,您可以同时监视、管理和诊断某一组中的所有节点。节点可以属于多个组。可以在作业模板中指定节点组以帮助管理群集资源。通过节点组,用户还可以将作业提交给某一特定的节点集,或提交给多个节点集的交集。

  有三个默认组:HeadNodes、ComputeNodes 和 WCFBrokerNodes。某一节点属于这些组中的哪一个组是由在安装 HPC Pack 2008 时最初设置的节点角色决定的。

  对计算节点进行分组

  1、在"节点管理"的"导航窗格"中,单击"节点"。

  2、在"热图"或"列表"视图中,选择一个或多个节点。

  3、右键单击所选项,指向"组",然后单击"新建组"。

  4、在"添加组"对话框中,为新组键入名称和说明。

  5、单击"确定"将选定的节点加入到新组中。新组将出现在"导航窗格"中的"按组"下。。

  6、将节点分配到组:

  右键单击一个或多个节点,指向"组",然后从组列表中选择要将节点加入到的组。

  7、从组中删除节点:

  右键单击一个或多个节点,指向"组",然后从组列表中清除要将节点从中删除的组旁边的复选标记。请注意,如果同时选择了多个节点,则只有适用于所有选定节点的组才用复选标记指明。

  注意:在"导航窗格"中单击"按组"可以在查看窗格中显示节点组列表,还可以编辑自定义组的名称或说明。单击某一组可以在"详细信息窗格"中显示组属性以及成员节点列表。

  其他注意事项

  "节点组"作业属性可以列出一个或多个节点组。作业只能在属于所有列出组的成员的节点上运行。例如,如果列出的组为"Have Application X"和"Have Big Memory",则节点必须同时属于这两个组。

  要打开 HPC 群集管理器,请单击"开始",指向"所有程序",单击"Microsoft HPC Pack",然后单击"HPC 群集管理器"。如果出现"用户账户控制"对话框,请确认所显示的是您要执行的操作,然后单击"继续"。
 

  (二)了解节点角色

  安装 HPC Pack 2008 时,将设置该节点将充当头节点还是计算节点。在将节点添加到群集之后,可以修改节点角色:可以将计算节点或 Windows Communication Foundation (WCF) 代理节点角色添加到头节点,并且可以将计算节点更改为 WCF 代理节点。同样,可以从头节点删除其他角色,或者可以将 WCF 代理节点更改为计算节点。

  通过更改节点角色,您可以很容易根据当前需要调整计算节点和 WCF 代理节点。若要确定需要为每个角色配置多少个节点,可以按以下三个只读节点组中的某一个对节点进行筛选:HeadNodes、ComputeNodes 和 WCFBrokerNodes。若要确定特定节点有哪个角色(包括头节点的其他角色),可以在"详细信息窗格"中查看节点的"组"属性。

  (三)监视节点

  监视和维护群集运行状况的关键步骤是发现与正常操作状态或性能的任何偏离。HPC 群集管理器使您能够直观查看群集和节点状态、识别问题节点以及深究节点细节以便作进一步调查。

  直观查看群集状态

  在"节点管理"中,可以使用节点"列表"视图或节点"热映射"视图直观监视群集。

  查看节点

  在"节点管理"的"导航窗格"中,单击"节点"查看群集中的所有节点。

  或者,还可以在"导航窗格"中单击"按组"、"按状态"、"按节点模板"或"按运行状况"下的项目来查看群集中节点的子集。

  在视图窗格中将出现节点列表("列表"视图)。

  在视图窗格中,单击"热映射"切换至"热映射"视图。

  双击某一节点可查看有关该节点的详细信息,例如硬件、操作系统属性和当前性能度量标准。

  了解节点列表和热映射视图

  在"列表"视图中,每一行代表一个节点,各列分别显示节点属性和度量标准值。可以单击列标题按特定属性对列表进行排序。通过选择要显示哪些列,可以自定义"列表"视图:在工具栏中,单击"查看",然后单击"列选择器"。

  在"列表"视图中,有三种图标可能会出现在节点旁边,用于指明节点运行状态:

  红色十字指明该节点无法访问或该节点的设置失败。

  黄色警告标志指明该节点的诊断测试失败。

  蓝色圆圈指明正在进行的操作。

  单击"列表"视图中的节点时,有关该节点的详细信息会出现在"详细信息窗格"中。"详细信息窗格"显示有关节点的信息,例如硬件、操作系统属性和当前性能度量标准。双击节点可在单独的窗口中查看该信息。

  节点热图视图

  在"热图"视图中,每一单元代表一个群集节点,所跟踪度量标准的值用颜色渐变表示。您可以从"度量标准"下拉列表中选择要跟踪的性能度量标准。"热图"每次最多显示三个度量标准。

  某一度量标准的最小值与一种颜色(例如,白色)相关联,该度量标准的最大值与另一种颜色(例如,蓝色)相关联。在此例中,该度量标准的较低值显示为较浅的蓝色,较高值显示为较深的蓝色。对于每一个度量标准,您可以自定义最大值和最小值以及相关联的颜色:在工具栏中,单击"选项",然后单击"自定义视图"。

  双击某一节点可查看有关该节点的详细信息,例如硬件、操作系统属性和当前性能度量标准。

  深究单个节点细节

  "列表"和"热映射"视图为发现问题区域提供了入口点。双击计算节点可以查看诸如硬件、操作系统属性和当前性能指标这样的详细信息。还可以选择一个或多个节点,然后深究节点细节,以调查性能。

  运行诊断测试:针对一个或多个计算节点运行诊断测试。

  在"节点管理"的"导航窗格"中,单击"节点"。

  在"列表"或"热图"视图中,选择一个或多个节点。

  右键单击所选项,然后单击"运行诊断"。

  在"运行诊断"对话框中,在下拉列表中选择一个测试,或选择"运行所有功能测试"单选按钮。

  单击"运行"。

  查看测试结果:在"诊断"的"导航窗格"中,单击"测试结果"。已运行的诊断或正在运行的诊断将出现在查看窗格中。

  查看性能图表:查看计算节点随时间变化的性能指标图表。

  在"节点管理"的"导航窗格"中,单击"节点"。

  在"列表"或"热图"视图中,选择某一节点。

  右键单击所选项,然后单击"查看性能图表"。

  在"性能图表"对话框的"度量标准"下拉列表中,选择要绘制图表的性能度量标准,然后单击"添加"。

  查看节点事件:查看由特定计算节点上的 HPC 服务生成的事件。

  在"节点管理"的"导航窗格"中,单击"节点"。

  在"列表"或"热映射"视图中,单击节点。

  在"操作"窗格中,单击"查看事件"。

  打开远程桌面连接:打开与一个或多个计算节点的远程桌面会话。

  在"节点管理"的"导航窗格"中,单击"节点"。

  在"列表"或"热映射"视图中,选择一个或多个节点。

  右键单击选择,单击"远程桌面"。

  出现提示时,输入凭据以连接到每个远程服务器。

  在远程桌面控制台中,您选择的节点将出现在"当前节点"下。单击列表中的节点以打开远程桌面连接。

  若要更改"当前节点",请单击"所有节点(筛选)"。使用筛选器下拉列表可以使节点列表范围缩小到您感兴趣的子集。

  监视节点操作

  跟踪最近或正在进行的群集操作是对管理群集有重要意义的另一个监视方面。Windows HPC Server 2008 将存档最近的操作,并允许您实时查看正在进行的操作的进度。有关详细信息,

  阅读操作日志

  使节点、作业、操作和诊断之间的监视信息相关联

  在 HPC 作业管理器中,可以使用"透视到"操作使节点、作业、操作和诊断之间的监视信息相关联。例如,可以在视图窗格中选择一个或多个节点,然后透视到"所选节点的作业"。这将转到按您选择的节点进行筛选的作业列表视图。

  受支持的透视路径是:

  节点:透视到作业、测试结果和操作。

  作业:透视到节点。

  测试结果:透视到失败的节点和操作。
 

  (四)重新镜像计算节点

  可以使节点脱机,然后使用最初用来部署该节点的节点模板重新镜像该节点。

  重新镜像一个或多个计算节点

  在"节点管理"的"导航窗格"中,单击"节点"。

  在"列表"或"热映射"视图中,选择一个或多个节点。

  右键单击所选项,然后单击"脱机"。

  节点脱机后,再次右键单击所选项,然后单击"重新镜像"。

  出现提示时,单击"是"确认您要重新镜像节点。计算节点的状态将从"脱机"更改为"正在设置"。

  如果您要跟踪设置进度,请选择节点,然后在"详细信息窗格"中单击"设置日志"选项卡。

  完成重新镜像过程后,计算节点的状态将从"正在设置"更改为"脱机"。要使节点联机,请选择节点,右键单击,然后单击"联机"。
 

0
相关文章