(二)了解节点角色
安装 HPC Pack 2008 时,将设置该节点将充当头节点还是计算节点。在将节点添加到群集之后,可以修改节点角色:可以将计算节点或 Windows Communication Foundation (WCF) 代理节点角色添加到头节点,并且可以将计算节点更改为 WCF 代理节点。同样,可以从头节点删除其他角色,或者可以将 WCF 代理节点更改为计算节点。
通过更改节点角色,您可以很容易根据当前需要调整计算节点和 WCF 代理节点。若要确定需要为每个角色配置多少个节点,可以按以下三个只读节点组中的某一个对节点进行筛选:HeadNodes、ComputeNodes 和 WCFBrokerNodes。若要确定特定节点有哪个角色(包括头节点的其他角色),可以在"详细信息窗格"中查看节点的"组"属性。
(三)监视节点
监视和维护群集运行状况的关键步骤是发现与正常操作状态或性能的任何偏离。HPC 群集管理器使您能够直观查看群集和节点状态、识别问题节点以及深究节点细节以便作进一步调查。
直观查看群集状态
在"节点管理"中,可以使用节点"列表"视图或节点"热映射"视图直观监视群集。
查看节点
在"节点管理"的"导航窗格"中,单击"节点"查看群集中的所有节点。
或者,还可以在"导航窗格"中单击"按组"、"按状态"、"按节点模板"或"按运行状况"下的项目来查看群集中节点的子集。
在视图窗格中将出现节点列表("列表"视图)。
在视图窗格中,单击"热映射"切换至"热映射"视图。
双击某一节点可查看有关该节点的详细信息,例如硬件、操作系统属性和当前性能度量标准。
了解节点列表和热映射视图
在"列表"视图中,每一行代表一个节点,各列分别显示节点属性和度量标准值。可以单击列标题按特定属性对列表进行排序。通过选择要显示哪些列,可以自定义"列表"视图:在工具栏中,单击"查看",然后单击"列选择器"。
在"列表"视图中,有三种图标可能会出现在节点旁边,用于指明节点运行状态:
红色十字指明该节点无法访问或该节点的设置失败。
黄色警告标志指明该节点的诊断测试失败。
蓝色圆圈指明正在进行的操作。
单击"列表"视图中的节点时,有关该节点的详细信息会出现在"详细信息窗格"中。"详细信息窗格"显示有关节点的信息,例如硬件、操作系统属性和当前性能度量标准。双击节点可在单独的窗口中查看该信息。
节点热图视图
在"热图"视图中,每一单元代表一个群集节点,所跟踪度量标准的值用颜色渐变表示。您可以从"度量标准"下拉列表中选择要跟踪的性能度量标准。"热图"每次最多显示三个度量标准。
某一度量标准的最小值与一种颜色(例如,白色)相关联,该度量标准的最大值与另一种颜色(例如,蓝色)相关联。在此例中,该度量标准的较低值显示为较浅的蓝色,较高值显示为较深的蓝色。对于每一个度量标准,您可以自定义最大值和最小值以及相关联的颜色:在工具栏中,单击"选项",然后单击"自定义视图"。
双击某一节点可查看有关该节点的详细信息,例如硬件、操作系统属性和当前性能度量标准。
深究单个节点细节
"列表"和"热映射"视图为发现问题区域提供了入口点。双击计算节点可以查看诸如硬件、操作系统属性和当前性能指标这样的详细信息。还可以选择一个或多个节点,然后深究节点细节,以调查性能。
运行诊断测试:针对一个或多个计算节点运行诊断测试。
在"节点管理"的"导航窗格"中,单击"节点"。
在"列表"或"热图"视图中,选择一个或多个节点。
右键单击所选项,然后单击"运行诊断"。
在"运行诊断"对话框中,在下拉列表中选择一个测试,或选择"运行所有功能测试"单选按钮。
单击"运行"。
查看测试结果:在"诊断"的"导航窗格"中,单击"测试结果"。已运行的诊断或正在运行的诊断将出现在查看窗格中。
查看性能图表:查看计算节点随时间变化的性能指标图表。
在"节点管理"的"导航窗格"中,单击"节点"。
在"列表"或"热图"视图中,选择某一节点。
右键单击所选项,然后单击"查看性能图表"。
在"性能图表"对话框的"度量标准"下拉列表中,选择要绘制图表的性能度量标准,然后单击"添加"。
查看节点事件:查看由特定计算节点上的 HPC 服务生成的事件。
在"节点管理"的"导航窗格"中,单击"节点"。
在"列表"或"热映射"视图中,单击节点。
在"操作"窗格中,单击"查看事件"。
打开远程桌面连接:打开与一个或多个计算节点的远程桌面会话。
在"节点管理"的"导航窗格"中,单击"节点"。
在"列表"或"热映射"视图中,选择一个或多个节点。
右键单击选择,单击"远程桌面"。
出现提示时,输入凭据以连接到每个远程服务器。
在远程桌面控制台中,您选择的节点将出现在"当前节点"下。单击列表中的节点以打开远程桌面连接。
若要更改"当前节点",请单击"所有节点(筛选)"。使用筛选器下拉列表可以使节点列表范围缩小到您感兴趣的子集。
监视节点操作
跟踪最近或正在进行的群集操作是对管理群集有重要意义的另一个监视方面。Windows HPC Server 2008 将存档最近的操作,并允许您实时查看正在进行的操作的进度。有关详细信息,
阅读操作日志
使节点、作业、操作和诊断之间的监视信息相关联
在 HPC 作业管理器中,可以使用"透视到"操作使节点、作业、操作和诊断之间的监视信息相关联。例如,可以在视图窗格中选择一个或多个节点,然后透视到"所选节点的作业"。这将转到按您选择的节点进行筛选的作业列表视图。
受支持的透视路径是:
节点:透视到作业、测试结果和操作。
作业:透视到节点。
测试结果:透视到失败的节点和操作。