服务器 频道

Scott Tease:NeXtScale(飞虎)新品详解

  【IT168 资讯】秉承对x86服务器市场走向和客户需求的深刻洞察,IBM System x长期以来一贯专注于x86平台的创新与研发。2013年9月13日下午,IBM System x“重塑数据中心,变革密度之道”NeXtScale新品发布会在京拉开帷幕。作为IBM新一代高密度系统,NeXtScale将为客户提供一个高密度、高可扩展、更灵活的计算平台,以其三大特性助企业轻松应对在云计算、高性能运算等领域的工作需求。

  专门针对新兴工作负载而设计的NeXtScale,能够提供超级计算机的强大性能,其简单、灵活、开放的架构能够为不同的计算、存储及图形处理加速提供支持。在NeXtScale新品发布会上,IBM系统与科技部System x超大规模计算解决方案总监Scott Tease先生为大家详细解读了NeXtScale的产品性能和特点,以及NeXtScale研发工作中的三大原则。此外,他还与参会者分享了“飞虎”这个中文名的设计由来。

Scott Tease:NeXtScale(飞虎)新品详解
▲IBM系统与科技部System x超大规模计算解决方案总监Scott Tease先生

  以下是Scott Tease先生演讲实录:

  “飞虎”由来:中美合作 开发更优秀的产品

  首先我要和大家分享的是为什么设计了NeXtScale这个产品。为什么把这个产品选择为“飞虎”。我们先做一个产品的系统演示,然后再看一下系统设计里,如何更加降低成本,降低能耗。

  为什么选择“飞虎”这个名字呢?当我们设计这个产品的时候,我当时住在台北。我们这个产品完全是由中国方面主导的,这是第一次中国的台北团队主导这个产品的开发,美国方提供一些资助,这是具有里程碑意义的。我们在美国三角公园研发团队都有我们的实验室,每一个新产品都需要一个代码,我们之所以选择一个代码是我们不知道这个产品之后的正式名字是什么样子的,所以我们给它一个代码就可以了。

  我们选择了很多凶恶或者危险的动物作为我们的名字比如狮子、鲨鱼,这种情况下我们想尽量选择一个表达中美合作关系的名字,我们回顾了一下历史,我们发现了“飞虎”这个名字,“飞虎”是美国二战时期的飞行员他们来到了中国驻扎在中国昆明,他们和中国空军并肩战斗抵抗日本的侵略,这个故事有伟大意义,是中美合作的例子,以便建立更美好的世界,这是我们为什么选择了“飞虎”的原因。现在我们称为NeXtScale,并不如“飞虎”这个名字更有意义,它意味着我们全球不同实验室之间的合作。

  研发三大原则:灵活性、简化性、可扩展性

  在开始研发工作的时候我们有三个原则需要注意,第一个原则是灵活性,我们需要确保这个产品有很强的灵活性,有两个方面,一方面是我们的客户如何订购和接受这个产品;二是能够非常容易的让客户把新的硬件、软件以一种不同的方式完全融合于他们的数据中心,也就是说对现有的实验室、现有的系统、现有的非常好的实践能够完美融合;

  第二个原则是简化性,我们想建造一个强大系统但是我们想让它更易于理解,更简约,我们知道客户有不同的任务,他们需要IT部门做不同的工作,在一个系统里不仅仅能够做比较复杂的计算,而且他们能够增加存储或者增加GPU。

  最后一个原则是可扩展性。当我们设计这个系统的时候,它可以在任何规模上进行应用,从小的数量到大的数量上,我们希望这个系统不断地增长,随着客户的需要扩展。有时候客户购买一个机箱,几个服务器,不断地扩展。有些客户需要购买一个机架,有些人一下子购买一个数据中心,所以我们希望给客户提供不同的解决方案。这是三个我们开发产品的原则,我们很好地开展了工作,也坚持了我们的原则。一会儿我介绍一下我们根据这些原则已经作成功的研发工作。

  我们有一个6U的机箱,在里面可以有12个插槽,可以加服务器、存储器、GPU、加速器、协处理器加速节点,这些都可以在机箱内,它们也可以互相混合。即使它的密度比较大,但是仍然可以放在一个标准的机架上。在演示中心大家可以看到,它是绝对标准的机架,所以很容易安装,无论在什么地方。这些想法是在我们设计之初就考虑到的。

  我们使用了HPC,中国对于HPC进行了大量投入,无论是政府还是高等院校还是业界都如此,而且我们相信将取得很好的成果。因为在云技术,公有云、私有云,我们的产品也会提供非常高性能的服务。

  NeXtScale产品解析

  再看看NeXtScale产品的时间表。今天在中国我们推出了机箱,发货时间是2013年10月28日开始,这是我们第一个产品的交付。第二项是一个存储单元放在服务器之上,将在11月发布。第三个产品是2014年上半年发货,是协处理器,在这里可以放置GPU或者英特尔的Xeon E5,还可以选择相应的托架,我们在相应的时候进行增加。现在使用的节点在未来可以改变,改变它的性能,所以说它的灵活度是非常高的。在这里每一个托架都是43毫米1U的高度,在这里面放置的服务器是1U的两倍,这里我们展示出它是金属架构,是非常简单的设计。

  NeXtScale有6个电源,这6个电源都是来自于高性能服务器,无论是1U还是2U,塔式服务器都是相同的,它的成本很低,效率很高,6个电源可以给我们提供冗余供电,在未来增加更多的机箱。后面还有风扇,最多可以达到10个80毫米的风扇可以提供所有的冷却能力,冷却在机箱前部的所有设备,在前部就不需要制冷了。这些风扇是热插拔、冗余的。

  如果有一个1U服务器,把它打开,这里面至少有4个风扇,很可能达到8个风扇,总共是48个或者96个风扇。但在我们的产品中12个服务器只需要10个风扇,所以它的效率很高,耗电量很低,而且他们可以在机箱前部很大工作负荷的情况下进行有效制冷。在后端还有风扇以及电源控制器,这个设备可以追踪电源和风扇的工作情况,而且可以把它的相关数据报告给机箱前部的节点,如果后部的风扇拿出来,控制器就会发出报告,然后服务器决定采取什么样的行动。

  如果服务器的温度过高,它就会给FPC发出指令,让风扇的转速提高,增强制冷能力。如果大家对于刀片设计比较熟悉的话,大家会看到在我们的机箱中没有交换机,它都是嵌入其中的。所有的I/O和网络都是直接从前端到机柜顶端的服务器,这样可以降低成本,而且还可以简化预垒,我再把它转回来。

  下面我们看一下服务器,里面有1U的2路服务器,高性能的12核,此外还有最高性能的内存、存储设备,在这个设备上有两个2.5英寸的驱动,可以在里面放两个2.5英寸的,可以为我们的操作系统提供映象和冗余。在图中我们还有另外一个版本的服务器,它是一个3.5英寸驱动,它特别适用于采用低成本实现高能力的客户,它可以达到4TB,这是第二个选择。第三个版本,我们可以利用这些空间,放入四个1.8英寸的SSD。它的优点是可以提高I/O的性能,如果有4个SSD放在服务器上,就可以达到与300个硬盘驱动相同的I/O性能。

  图中左处是我们的电源件,LED指示灯,往右可以看到很多插口,这是为了提高I/O性能的。我们可以选择不同的品牌,选择不同的I/O,所有的都已经自动放在服务器中了。再往右看到了一个插口就是KVM,这里可以插入直接与视频、键盘、鼠标直接相连。还有一个直接的管理界面,这个节点的优点是含有标准的PCI插口,如果要实现I/O这是很好的。如果有一个非IBM的子卡,也可以插入其中。这里有一个卡可以驱动这两个程序,这样可以帮助我们实现高灵活度,尽管它很小,它的性能非常高,它是一个高性能服务器。实际上这个服务器可以运行世界上最高性能的超级计算机。

  现在展示的是它的内部有很多这样的服务器节点,我们知道客户所需要的不仅仅是计算和处理能力,我们突出了一个功能:本地扩展。我们可以把节点打开,把它转化为GPU或者存储节点。如何做呢?我们把上面的盖子拿下来,在这个版本当中有1个3.5英寸的驱动,在上面再放一个托盘,其中还有另外7个3.5英寸的驱动。我们把这两个结合在一起,这样就有一个2U高半宽的服务器,它支持32TB的存储能力。所以我们可以在6U的机箱中放入这样的节点,它可以使存储能力增加一倍,在传统的1U上是不可能实现这一点的。使用的方法是不使用硬盘驱动,我们使用GPU或者Xeon E5相同的理念,里面有这样的处理器把它放到一个1U当中,所以它的密度是非常高的。

  这使我们可以进行混插储,并且GPU的加速在一个设计当中实现以上所有的功能。我们在这里有LED灯,所有的线还有电源开关都在前端,我们可以看到这个设计与众不同的,为什么呢?我们要实现安装运行和维护的简便。想像一下数据中心,我们在数据中心安装了设备,肯定是一个机柜挨着一个机柜,一排排的。如果在一个节点出现了鼓掌,就要绕着这一排机柜走一圈,走到它的后面找出出现问题的节点。然后把这个线拔出。这是非常困难的,在非常黑暗的环境里找出正确的线拔出,非常困难,很容易出错。所以我们把它放在前端,开关、LED都放在前端,这样使操作非常简便。

  另外一点,我们的工作人员希望可以在凉风习习的环境中工作,机柜前端的温度是18-27摄氏度,后端是38摄氏度。因为空调都设在前端,所以后端温度就非常高,这样我们把所有设计都放在前端,工作人员就可以在非常舒适的环境中进行工作了,这是前端布线的优点。

  另外,需要指出的是服务器后端没有大量布线,就可以更好地进行迁移。我们可以在40度的大型数据中心中进行运作。现在很多大型数据中心的温度设计都是很高的,它的原因是可以降低成本,比如说降低制冷成本。我们的高密度服务器竞争对手最高可以达到35度,我们可以达到40度,这都归功于我们前端的设计。

  下面介绍第二个原则灵活,灵活要分成两部分来看,第一个是产品如何交付,第二是我们收到产品后如何使用,如何把它放到现有的环境中,举个例子就是希望如何收货。有些客户希望以传统的箱子的方式收到货,自己组装然后装到机柜中,我们可以实现。就像图中展示的一样,产品放装在不同的箱子里交付给客户,或者我们直接建造好机柜,我们生产服务器把它放在机柜中,并且进行布线,而且进行客户定制化的清晰标志,放在端口,进行基本控制单元的设计,还可以进行压力测试、要实现的目标是测试机柜当中所有组成部分的承受压力的能力,而且它的生产安装都是正确的。所以我们把这个机柜交给客户的时候就可以即插即用。

  人们经常问到我的问题是它的成本是多少。IBM组装和客户组装的成本差多少?这里我们给大家列出都是一些数据,有很多纸皮箱、泡沫、纸张和木材用于包装。我们把服务器进行配置交付给客户的时候,这些包装成本都可以节省下来,把他们交给深圳的团队让他们来组装机柜进行配置,这样从收到机器到投入生产的时间就可以大大缩短,而且不需要进行包装处理,IBM会妥善地回收利用。另一方面,灵活还可以体现在使用上,NeXtScale可以实现所有的IBM的业务,包括管理软件,我们有传统的工具,还有UEFI、XCAT还有Platform Computing软件进行优化,还有一些客户已经有了相应的标准,不需要使用IBM的工具,我们也可以完全提供开源环境,我们使用IBM的Value Stack,我们可以与现有的系统进行融合,这是我们所说的灵活使用,也就是说我们是不是可以把它非常容易的融入到你现有系统当中。

  最后一个原则:扩展。我们多次向客户重申,无论他开始的规模如何,增长的速率是什么,NeXtScale都可以助力他们的扩展。有些客户一开始购买一个空的机箱或者其中只有一到两个节点,此后不断的增加计算能力和存储能力,你可以购买一个机箱以后随着演进我们增加系统,而且很容易扩展。如果你想比较快的做,我们可以提供配置好的机架,你可以更快的配置。如果中国公司发展非常快,在他们数据中心的基础上我们能够做的其他事情,我们能够在一个集装箱内运装一个浓缩的数据中心,就像中国和其他国家通过集装箱所运送的货物一样,这些电源、各种各样的数据中心的设备都可以通过集装箱运过去。你可以在开始的时候买一些小的东西,然后再逐渐地扩展。

  这个系统主要是关于至强E5-2600 v2这个产品,所有产品都可以支持微处理器,这些处理器,能够每个服务器增加15%的内核,这也是非常好的特点,当你考虑这一点的时候,现在有两个服务器在1U的空间上。

  我们还发布了另外一个新产品System x3650 M4 HD。它是2U服务器,我们销售这个产品多过其他产品线的任何产品,这个产品对大数据分析,对数据管理都有非常高性能的支持,而且还会有非常好的I/O性能。这个系统中有很多的驱动器,同样可以混合。另外一个好处是它提高了更高的吞吐量和磁盘容量。如果你已经是我们的客户,你不需要做任何的改变再装新的处理器,在已有的系统上就可以增加这些性能,这是非常了不起的。

0
相关文章