服务器 频道

像滴滴一样做HPC运维或许不是梦!

    【IT168 资讯】曙光针对高性能计算集群推出的专业化在线平台EasyOP,首次亮相是在去年11月全国高性能计算学术年会上,这一致力于实现用户HPC资产“全生命周期”管理服务的在线平台,首次以“互联网+HPC”的模式出现。

  对于连续第八年蝉联中国高性能计算机TOP 100市场份额第一的曙光来说, HPC的积淀与实力这就是最好的佐证。而扩展到HPC服务,用曙光高性能产品事业部副总经理吉青的话说则是“扶上马送一程。” 作为基于曙光Gridview集群管理体系专为HPC量身打造的在线平台,EasyOP的使命是让用户的HPC用的更加"顺手"。

像滴滴一样做HPC运维或许不是梦!

  EasyOP不止于便捷运维

  在技术方面,曙光五大关键技术的EasyOP“运维神器”——监控数据实时远程采集、海量数据存储与展示、故障的分析与定位技术、大量数据统计与分析、移动终端的集成与推送,将HPC在线运维变得简单。

  经过不到一年的试运营,EasyOP已经累计接入超过万个HPC节点,覆盖了CAE、气象、海洋、物理、生物、高分子六大领域,对所有接入集群资产全面监控指标超过180项,全部集群共自动触发2800+通知信息。

  在功能方面,EasyOP也进行了完善和改进。去年推出的版本仅仅只针对于超算中心的管理员,如今新版本已经能扩展到所有提交作业的人,并且可以在微信端使用,同时新版本还增加了异常作业报警功能。

  这里值得一提的是,在消息中心,无论是集群管理员和普通用户之间,还是普通用户之间都可以方便的进行交流。曙光希望这样的交流不仅仅是在某一个集群之内,还可以纵向在行业内扩展。

  EasyOP的贴身售后服务,既有传统的400电话,也有新兴的微信服务、工单系统,通过EasyOP在线运维平台,用户可以在手机上或者网页端多方位地看到自己集群的运行情况、作业情况、磁盘占有率等等,这就是EasyOP的千里眼功能。

  而看门狗模块,顾名思义就是它会通过短信、微信或者是邮件的形式自动触发报警。而这个报警则是根据各超算中心不同情况进行预置。

  超算中心要盈利,自负盈亏,其账房先生模块中的计费功能已经实现自动生成月报、年报数字,极大简化了年底报告的压力,并可随时随机提取生成报告。

  HPC也谈共享经济

  不过除了吉青所说的扶上马送一程以及让HPC简单运维,曙光更希望把EasyOP做成HPC业界的资源交易平台。也就是说,当其中一个超算中心没有时间管理,抑或是出了问题需要专家去维护时,EasyOP可以去接这个单。再比如,如果有超算中心需要做渲染,同样可以通过这个平台来发出邀请并完成交易。

  这里谈到的资源交易包括计算资源、专家资源和知识资源。

  计算资源方面,EasyOP将实现作业的跨集群调度,不同用户在集群与集群之间可以共享计算资源;集群管理者也可把闲置计算资源放在EasyOP在线运维平台,供“计算需求者”选择使用,从而将闲置资源转化为收益;同时在线资源交易平台是双向开放平台,任何高性能计算使用用户或使用单位都可注册成为EasyOP用户,选择自己需要的计算资源。

  专家资源包括程序专家,如优化,代码移植,软件共享,计算结果解析等等也是资源交易可以涵盖的范围。同时更加是包括各个应用方向的应用专家,他们可以分享自己对研究方向的认识,应用软件的设置,调优技巧,还可以包括计算结果的专业解析等等。

  知识资源涵盖从基础设施、硬件设备、管理平台到应用软件,曙光在HPC领域拥有深厚的技术积累和知识储备,这些将通过“EasyOP在线运维平台知识库”共享给广大用户,并且用户也可参知识库的构建,从而形成强大的高性能计算专业知识体系。据透露,在知识库分享资源或者评论都可以赢取EasyOP使用时长的奖励。

  吉青也强调说,这个资源交易与我们通常谈到的机时交易是有本质区别的。对于曙光这样一家做了近二十年HPC的企业而言,数据就是宝贵的资源。这也使得EasyOP具备了如滴滴这样的平台的资本。

  “在曙光的设计理念里,对超算的理解、分析是一种更为有效的资源,也是含金量最高的资源,我们希望通过这个平台,这种资源可以得到更好社会级的共享。”吉青如此谈到。

  “我们在农业社会落后了,工业社会落后了,在信息化社会还要落后吗?也就是在这样一个时代,我们有机会跟国外企业站在同一个起跑线上。虽然中国的高性能计算在应用方面,我们还有一点点差距,但是仅从计算机来说我们甚至是领先于他们的。我们的天河一、二号,太湖之光都充分体现出这一点。尤其是我们的E级计算机无论是从时间的进度表还是原型机本身的一些技术性指标,都是高于国外的。” 可以看出,在吉青的心里,还有一个更深的中国情结,吉青谈到此处是兴奋的也是自豪的,因为在HPC领域,即便是从国际视野来看,这都是一个全新的理念。

0
相关文章