【IT168 专稿】周松年,Platform Computing公司CEO,网格计算技术的倡导者之一。他在其博士论文中就开始研究分布式资源管理,并随后创建了Platform公司。作为一名成功的企业家,周松年将Platform由一个仅有3名员工的小公司发展成为一家拥有400余名精英,在全球拥有15个办事处的国际型企业。
在本次采访中,主要与周松年先生共同探讨了以下几个问题:HPC和网格技术是如何发展的?如何帮助用户更快的接受这种技术?以及厂商的市场机遇何在?
记者:在过去的一年里,您认为整个行业取得了怎样的成绩?
周松年:HPC行业在2007年继续保持了增长的态势,并走向成熟。越来越成熟和普及的计算密集型和数据密集型应用需求是这一市场的主要推动因素。对于大多数这样的应用而言,商品化集群服务器系统是非常理想的工具平台。它们有助于在更短的时间内解决更复杂的问题,或者得出更精确的结果。相对于专有的SMP和矢量架构而言,标准化集群系统硬件成本的大幅降低使更多的用户迅速的接纳了HPC系统,它不仅带来了节点计算性能的增加,也帮助厂商获得更多的收入。在一个能够提供具有吸引力的商业价值的市场,这是一种非常良性的循环。
行业取得进步的一个迹象是:用户对于商品化集成系统的期望越来越强烈。这种集成系统不仅要包括硬件,还要能够为终端用户提供管理软件。这种系统和5-10年前“由用户自己来组建”的集群形成了鲜明的对比。另一个迹象是基于企业网格架构的数据中心扩建。这种集中管理的系统可以被庞大组织中的所有用户所共享,而管理人员也可以进行集中的专业管理来保证系统的可用性并维持较低的成本。
记者:在2008年,整个行业将会面临什么样的机遇与挑战?
周松年:随着处理器速度越来越快,多核结构越来越复杂,整个产业如何才能在不增加IT系统复杂性的同时继续满足用户对强大计算能力的无止境需求呢?我们目前还找不到一个通用的解决方案。具有讽刺意味的是,在整个行业都将注意力集中在诸如X86处理器、Ethernet 、 InfiniBand 以及 Linux 和Windows 操作系统这些标准技术的同时,也有一些人转去开发各种各样的新技术,比如多核、GPU、FPGA和Cell处理器等。显然,这些对于软件编程界来说将是一场恶梦的开始。应用中间件和管理软件厂商面临的挑战在于:既要帮助程序员和最终用户开发利用上述技术所带来的强大性能,又要尽可能地降低上述技术所带来的复杂性,这一需求比以往任何时候都要强烈。因此,可以预见,在这样一个多变的市场中,机遇与挑战并存。
除了软件编程之外,厂商还要为越来越多的HPC用户提供“简单、容易部署、容易使用”的HPC环境。要知道,新加入的HPC用户需要强大的处理性能来应对他们的计算密集型和数据密集型应用需求,但他们本身并不是构建和管理集群系统的专家,所以他们需要的已经不再是那种“凑合着能用就行”的方案了。
记者: 作为HPC/网格技术的软硬件厂商,我们应该采取什么举措来促进这种技术的普及?
周松年:HPC的各个组成部分需要相互配套运作才能帮助用户实现他们所关心的价值:易于部署、易于使用以及较低的总拥有成本。对此,ISV需要开发的是那种能更好契合集群环境、更好地利用集群资源的应用软件和解决方案。比如SAS在其商业智能软件和预警分析软件中就嵌入了网格和集群功能。这也说明,网格技术在几乎所有行业领域都有可挖掘的应用价值。随着适用HPC集群的商业应用软件数量的增多,企业主管们将会发现集群技术在工程设计、金融财务分析之外的领域里的价值会越来越大。因此,厂商们需要加强协作,以确保他们的产品能够实现互连互通和互操作。
此外,集群系统应该是同一台装配操作系统和管理软件的SMP服务器一样简单。我这类HPC集群系统称作“集群服务器”,它的特点在于:成本较低而且可扩展。厂商之间的协作和产品的集成最好是基于工业标准和开放接口来进行,否则,很难把各种各样的组件有效地组合在一起。由Open Grid Forum(开放型网格论坛)支持开发的HPC Basic Profile(HPC基本规范)就是标准化发展方面一个例子。Intel Cluster Ready program是另一个例子,可以简化集群服务器的验证和部署工作。
记者: 在使用HPC技术方面,哪个行业或领域最具有创新性?
周松年:很多行业在HPC应用方面都具有创新性。比如,金融服务行业率先部署了内部公用共享的企业级网格,由IT部门集中管理,向众多业务部门提供服务。这种公用模式(或者称为共享资源模式)向整个组织开放网格计算服务,从而使得业务部门可以将诸如商业智能、数据分析等众多应用迁移到网格之上。从行业的角度来看,随着所能添加的应用程序越多,那么网格的价值也就越大。
除了传统的应用,交易前实时定价和分析应用也已经得到网格技术的支持。这是一种分布式的并行SOA,通过多个加载了数据的服务实例,能够在几毫秒时间内交付计算结果。在制造行业,HPC应用范围也正在从传统的CAE领域向生产计划过程拓展,可以将HPC应用整合进PLM(Product Lifecycle Management,产品生命周期管理)中去——这个过程被称作“HPC自动化”。得益于HPC的强大性能,商业分析软件开始成为一种成熟的应用模式,从而对业务过程本身进行优化,已经超出了传统HPC应用的范畴。而且我相信,HPC技术在新领域里的应用和创新会越来越多。
记者: 您认为2008年有什么技术趋势将会对行业产生最大影响,原因是什么?
周松年:集群将变得非常普遍,不仅应用于大型企业,而且也会被那些过去从来没有使用过HPC的用户所采纳,这也是HPC技术普及的一个最重要因素。用户不再会受到一台桌面计算机或者一台服务器计算能力的束缚,而是可以采用集群服务器。通过共享集群资源,用户用较低的成本就能获得更多的资源。
记者: 行业整合对用户有什么影响?
周松年:理性的整合是一个行业走向成熟和健康的标志。过去用户要从众多厂商那里分别购买软硬件,现在用户更喜欢和少量的厂商打交道,获得更具集成性的系统。整合可以帮助厂商实现规模经济,从而降低用户成本。而且通过增强一小部分厂商的市场生存能力,也可以降低用户的风险。我预计HPC系统的每个主要部分,比如服务器、互连网络和管理软件等,会被两三个竞争厂商所支配。
记者: 多核技术的持续发展将对HPC行业产生什么样的影响?
周松年:这种影响有积极的一面也有消极的一面。我还不清楚这么多的应用程序是否能够充分利用到多核技术。技术实现简单、并行I/O通道以及避免单点失效已经成为集群的主要优势。我期待这种体系架构能够得到继续发展。多核是整个行业不得不面对的一个重要问题。但在我看来,一套拥有多颗CPU,而且每颗CPU拥有多个内核的服务器集群是相当复杂的。