服务器 频道

关键业务平台 华为RH5885 V3服务器评测

  解读华为服务器iBMC智能管理系统

  华为FusionServer RH5885 V3服务器集成了华为服务器iBMC智能管理系统,该系统是华为自主开发的具有完全自主知识产权的服务器远程管理系统。iBMC兼容服务器业界管理标准IPMI 2.0、SNMP、支持键盘、鼠标和视频的重定向、文本控制台的重定向、远程虚拟媒体、高可靠的硬件监控和管理功能。

  主要功能一:系统运行记录仪

  iBMC提供了系统运行记录仪功能,该功能由黑匣子(KBox)模块、FPGA、iBMC、解析工具(hwkbox)四个模块协同完成,默认关闭。按照下图1-1所示,系统运行记录仪主要实现了linux系统内核panic时的内核栈信息记录和导出,以及提供给第三方应用的读写接口,便于第三方应用记录自定义信息;记录的系统故障数据(也称黑匣子数据)不会因系统重启和上下电而丢失,但AC掉电会丢失。

解读华为服务器iBMC智能管理系统
▲图1-1,系统运行记录仪原理

  应用场景一:在内核panic触发时,注册的黑匣子模块自动抓取内核栈信息,并写PCIe设备,通过DDR控制器将定位信息保存到DDR中,最多16M字节数据。待系统重启后, 通过对PCIe设备读操作,系统侧定位工具把保存在DDR中的定位信息读取并解析,辅助定位。 即使系统无法正常启动, DDR内的信息,也可以通过iBMC(如图1-2)导出并使用专门工具解析(目前只能导入到系统OS下使用hwkbox工具解析)。

解读华为服务器iBMC智能管理系统

▲图1-2,黑匣子数据下载页面

  应用场景二:系统第三方应用调用黑匣子模块写接口将运行日志记录到iBMC的DDR中,最多2M字节数据;当应用异常时,系统侧调用黑匣子模块读接口或通过iBMC将运行日志读取并解析以辅助问题定位。

  主要功能二:宕机截屏与宕机录像

  宕机截屏

  如图1-3所示,宕机截屏是iBMC在检测到宕机发生时将系统临终时刻的屏幕以指定的格式保存在iBMC的存储空间内。当用户发现系统宕机后,可以通过网络登录iBMC查看宕机屏幕进行故障定位或者远程将宕机屏幕获取到本地进行查看。

解读华为服务器iBMC智能管理系统

▲图1-3,宕机截屏原理

  iBMC最多支持保存3个宕机截屏,并在下一次宕机时自动覆盖最旧的一次截屏数据。

  可以参考“系统屏幕”通过Web查看宕机截屏,如图1-4所示。

解读华为服务器iBMC智能管理系统

▲图1-4,宕机截屏界面

  宕机录像

  iBMC在检测到系统宕机发生时会自动将宕机时刻前后各约一分钟的屏幕显示以压缩格式保存到外部存储器中,支持Host CAT Error、下电、重启场景的自动录像,其中Host CAT Error场景的录像文件保存在iBMC的FLASH,其它两种场景的录像文件保存到iBMC的内存中。当用户发现系统宕机时,可以先将宕机录像文件导出到本地,然后再打开iBMC的录像回放控制台在线播放,以帮助精确定位系统故障。

  可以在“录像回放”页面中打开录像回放控制台,如图1-5所示。

解读华为服务器iBMC智能管理系统

▲图1-5,录像回放控制台

  主要功能三:屏幕快照和屏幕录像

  屏幕快照

  屏幕快照是iBMC提供的一项方便系统巡检的功能,用户可以通过远程命令行(CLI)和WEB界面控制iBMC对当前系统的屏幕输出进行截取并保存。当用户需要查看时可以通过远程SFTP将文件获取到本地使用图片查看软件浏览所有被巡检服务器的当前屏幕。

  屏幕快照与虚拟KVM相比,省去了https登录过程,支持命令行接口,方便脚本集成实现服务器巡检自动化。此外通过web页面也可以获取当前系统屏幕快照。

  通过命令行方式获取屏幕快照

  命令格式

  ipmcset -d printscreen -v wakeup

  参数说明

  加参数wakeup时该命令截取屏幕图片并唤醒系统屏保。

  使用指南

  执行printscreen命令后,iBMC将自动把截图文件保存至tmp文件夹下,文件名为screen.jpg,查看此文件需要把图片文件通过FTP或SFTP传到可以查看。jpg文件的客户端中。

  通过Web界面获取屏幕快照

  通过Web界面,可以在“屏幕截图”的手动截屏页面下进行“截屏”操作获取当前的系统屏幕快照,如图1-6所示。

解读华为服务器iBMC智能管理系统

▲图1-6,手动截屏界面

  屏幕录像

  屏幕录像是虚拟KVM控制台上提供的一项远程KVM录像功能,需手动启动,录像格式为自定义,录像数据保存在本地(打开KVM控制台的计算机);当用户出于安全或者其他需要,要将虚拟KVM操作过程记录下来时,可以通过启动屏幕录像功能来实现。屏幕录像功能启动后,虚拟KVM控制台会自动将屏幕上的所有显示和操作都记录到自定义视频格式文件中。

解读华为服务器iBMC智能管理系统

▲手动录像开启/关闭

  iBMC WEB界面集成了录像文件播放工具用于录像回放。

解读华为服务器iBMC智能管理系统

▲录像回放控制台

  主要功能四:功率封顶

  现代数据中心一直面临的一项挑战是企业正在消耗大量的电源、空间和冷却成本。而随着能源需求以及能源和冷却成本的大幅度上涨,日益增长的可用能源的容量预计在未来几年里将跟不上需求的增长。对于当前的数据中心来说,最急需解决的问题就是通过技术创新实现节能降耗。在传统的数据中心中,客户为保证数据中心无间断运行,往往要耗费巨资来建设一套额外的电力基础设施。此外,IT管理员通常会以过度能源供应,来确保电力供应。iBMC提供的功率封顶技术可以通过有效地对每一台服务器能耗的准确控制,避免了能源的过度供应,有效地将能源中过度供应的部分能源用于数据中心扩容。

  在导航树上选择“电源与能耗 > 功率”,打开“功率”界面,如图1-7所示。

  功率封顶功能通过设置系统的功率预期上限,当系统功率超过此上限值后,引导特定动作发生,从而保证机箱整体功率的合理分配。

  系统启动过程中,iBMC每隔1秒采集一次系统功率,总共采集40次或更多,去除无效值,然后计算出平均值并乘以一个系数(每个产品可能不同)作为功率封顶下限参考值。

  在图1-7中,根据实际需要设置功率封顶使能状态、封顶功率、封顶失败进一步动作,单击“保存”按钮。设置成功后,界面将提示“操作成功”。

解读华为服务器iBMC智能管理系统

▲图1-7,功率封顶界面

  封顶失败进一步动作包括:

  记录事件:封顶失败后在系统事件文件中记录一条日志,默认执行。

  关机:封顶失败后,系统将在15秒内执行强制下电操作。

6
相关文章