服务器 频道

HPC 2012:云系统自主管理与检验检测

  【IT168 资讯】2012年10月29-31日,由中国计算机学会主办、中国软件行业协会数学软件分会协办、中国计算机学会高性能专业委员会、国家超级计算长沙中心、湖南大学共同承办的 “2012年全国高性能计算学术年会”(HPC China 2012)在湖南省张家界阳光酒店召开。本次大会上将举办CCF学科前沿讲习班,还邀请了国际高性能计算咨询委员会的中国高性能计算研讨会(HPC Advisory Council)的加盟。此外,会议期间还将举办“大数据论坛”、“并行计算教育论坛”、“超级/云计算中心论坛”。

HPC 2012:自主云控制系统的可靠性研究
中科院深圳先进技术研究院的须成忠教授

  30日,大会进入第二天。首场演讲来自中科院深圳先进技术研究院的须成忠教授,他进行的演讲题目为《云系统自主管理与检验检测》。须教授首先谈到了——深圳的超级云计算计划,目前这个计划依托于国家深圳云计算中心和中科院超算中心,具体项目有国家发改委的云计算平台和科技部的电子政务项目,还有科学院的“中国自主云示范平台”。

HPC 2012:自主云控制系统的可靠性研究

  从系统角度来说,目前的云计算平台可以提升系统运行效率、其次就是能耗的控制和系统成本问题。从管理的角度来说,通过自主的管理,能够实现系统在线管理。

HPC 2012:自主云控制系统的可靠性研究

  须教授还特别谈到了提高系统的子样利用率问题。他认为原来系统的管理开销不能满足云计算的高利用率要求,成本会呈几何层级增长。其次就是系统的可靠性,简单的冗余不能提升系统可靠性,在并行计算的情况下随着系统规模的增大而降低。而看看目前的百度、淘宝都是采用这样的方式,但实际情况是系统冗余并不一定能提升系统的可靠性(基于独立的计算模型)。这种方式是基于下面的前提——如果某个系统部件出现损坏、及时发现并停止,才能够提高。但在实际应用中,部件的损坏不仅仅不能够被及时发现,而且还会影响到其他的部件。

HPC 2012:自主云控制系统的可靠性研究

  现场,须教授还谈到了发改委云检验检测服务平台。这是一款开放式云计算平台xCloud,这个平台可以实现弹性管理,也就是能够实现对于虚拟机的优化、迁移、能耗管理等工作。

0
相关文章