【IT168 专稿】又到岁末,我们回顾并总结了2010年的六大热门领域的重要事件,并附上了重要事件的相关报道,为广大读者重温这一年市场的快速发展提供参考。
高性能计算领域热门事件盘点
高性能计算领域今年热点事件频出,先是曙光研制出龙芯刀片服务器(详见这里),紧接着其基于模块化刀片服务器TC3600的超级计算机“星云”(详见这里)就冲上了六月份Top500榜单的第二名(详见这里)。另一方面,英特尔推出了面向高并行度计算的“MIC”众核架构产品(详见这里),而“天河一号”以每秒2500万亿次的计算能力在年底的国内Top100和全球Top500中均夺得了第一名。
我们按时间顺序总结了高性能计算领域的四大事件如下:
事件一:龙芯刀片研发成功
曙光公司于4月份宣布研制成功龙芯刀片服务器,这标志着国产处理器首次应用在了高密度刀片产品中,也是首次应用在高性能计算领域。正如龙芯总设计师胡伟武在曙光龙芯刀片服务器发布现场所言,“我最早认为龙芯是一个项目,后来认为这是一个产品,现在才发现龙芯其实是一个产业链。”风雨八年,龙芯之路,并不平坦!
龙芯系列处理器发展到现在即将有三大路线图,分别是面向服务器和高性能计算领域的“大CPU”龙芯3A(龙芯刀片),未来曙光6000将采用的龙芯3B处理器(8核心);另一条路线则是面向普通计算机和嵌入式应用的龙芯2系列处理器,已经发展到了龙芯2F和龙芯2G;最后一条产品线是面向移动和消费电子的嵌入式龙芯1系列处理器。
笔者认为,相比国外主流x86厂商在制程和主频工艺等领域疯狂攀升性能,龙芯走了另一条路(MIPS架构),并且在多核心封装方面具有x86所不具备的优势。未来的曙光6000将成为国内超算首次使用国产处理器的里程碑,意义空前。
IT168服务器频道梳理了龙芯刀片发布的台前幕后,并对龙芯刀片服务器产品做了详细的图文解读,感兴趣的读者可以点击这里。
事件二:“星云”超算冲上Top500第二名
紧接着龙芯刀片的成功发布,曙光在6月份发布了基于模块化刀片服务器TC3600的超级计算机“星云”(详见这里)并冲上了六月份Top500榜单的第二名(详见这里)。“星云”超级计算机采用的是曙光最新的SSI模块化刀片服务器TC3600作为节点(点这里查看TC3600细节),其CPU+GPU的混合架构在针对“华大基因”这类公司的微生物计算方面拥有明显优势。
对“星云”超级计算机感兴趣的读者,可以点击这里。
事件三:英特尔推出“MIC”并行计算架构
英特尔发布“MIC”众核计算架构的目的在于对未来计算市场的预期——会有一部分应用是高并行度的。而另一方面来自Nvidia和ATI的GPGPU在编程方面又存在各种困扰,因此英特尔推出了“MIC”众核架构处理器,主要面向勘探、科研、金融、气候模拟等高性能计算(HPC)领域。
笔者认为,相比先期英特尔高调宣传却最终失败的“Larrabee”x86架构GPU来看,“MIC”产品是其研究成果的继任者,不过更加务实的着眼于专业领域。首先推出的“Knights Ferry”实验型产品并不商用而是面向合作伙伴的开发和测试工具;未来将推出的22nm工艺“Knights Corner”才是商用“MIC”产品,预计将集成超过50个众核处理器。
想进一步了解“MIC”架构产品的读者,可以点击这里。
事件四:“天河一号”爆冷夺Top500桂冠
今年10月末的全国高性能计算年会上,“天河一号”以2500万亿次的计算性能再次获得国内超算第一名的成绩(详见这里),并且在接下来的Top500排行中成为世界靠前(详见这里)。
国防科大自主研发的“天河一号”自去年以峰值性能1206万亿次夺得国内TOP100第一名以来(详见这里),经过对CPU和Tesla计算卡的升级以及今年新加入的国产飞腾系列处理器(详见这里),使其计算性能猛增到2507万亿次。
笔者在国内Top100榜单发布之初就曾撰文详细分析了天河一号夺魁的原因,以及系统规模,并对比了“天河一号”和“星云”的差异——想进一步知道“天河一号”更多细节的读者,可以点击这里。想进一步了解今年最新一期Top500排名的读者,可以点击这里。
下面是今年在高性能计算领域发生的主要事件时间表:
4月23日,曙光宣布成功研制出基于国产龙芯处理器的高性能刀片服务器CB50-A。
5月4日,曙光推出第二款个人高性能计算机“PHPC200”,运算速度达到2500万亿次。
5月31日,全球Top500排行榜出炉(2010年年中),曙光“星云”超级计算机位列第二。
5月31日,英特尔宣布将推出集成众核架构(MIC)产品,首批样品代号Knights Ferry,仅用于研究。
6月2日,Cray宣布推出基于AMD十二核皓龙6100的超级计算机“XE6”。
6月7日,“2010年中国高效能计算应用高峰论坛”将在北京举行,来自中国软件行业协会数学软件分会、中国科学院过程工程研究所、北京大学、中国科学院软件研究所、Nvidia、Intel、Mellanox的多位专家代表将就“GPU在高性能计算领域里的最新应用发展与挑战”展开演讲与讨论
6月25日,英特尔2010年高性能计算研讨会举行,主题“石油勘探挑战高性能计算”。
7月26日,微软发布新一代高性能计算(HPC)集群专用系统“Windows HPC Server 2008 R2 Suite”。
9月28日,浪潮承接山东信息通信技术研究院项目,开建“神威蓝光”千万亿次超级计算机。
10月27日~30日,2010年全国高性能计算学术年会在国家会议中心召开,其间公布了中国Top100超级计算排行榜,国防科大的“天河一号”以2500万亿次速度荣获第一,曙光星云名列第二。
11月13~19日,国际超级计算大会在美国举行,其间发布了全球高性能计算机Top500排行榜,中国“天河一号”名列第一,曙光星云名列第三。
11月24日,世界超算Green500,能效排行榜公布,天河一号排名第11位。
服务器处理器领域热门事件盘点
今年对于服务器处理器来说是重大发布频出的年份,从2月份开始IBM发布了Power 7系列小型机处理器(详见这里),到英特尔紧随其后的安腾处理器(详见这里),再到3月中旬英特尔发布的x86架构32nm新工艺六核至强5600系列处理器(详见这里),再到3月底发布的业界最强x86处理器八核至强7500(详见这里),然后是AMD在4月中旬发布的12核皓龙处理器(详见这里)以及6月发布的皓龙4100处理器。
综上可见,上半年服务器领域一共发布/更新了六款CPU处理器,x86架构新处理器呈井喷趋势,也带动了一大批服务器的升级换代。
另一方面,Nvidia相机推出了面向高性能计算领域的Fermi架构Tesla计算卡(详见这里)。在收购了Sun之后,Oracle于9月发布了第一款处理器SPARC T3(详见这里),拥有16核心128线程。此外,ARM架构处理器也正式进入服务器市场(详见这里),并被Facebook正式采用。11月中旬,英特尔发布了面向嵌入式领域的凌动E600系列处理器。
处理器一:IBM Power 7
2月份IBM正式发布了Power 7系列处理器,采用45nm工艺300mm晶圆制造,核心面积567mm2,频率3.0GHz到4.1GHz。提供4核、6核、8核心型号,每个核心支持4线程,因此每颗处理器最高同时支持32线程运算。(详见这里)
作为Power系列小型机的新型处理器,IBM Power 7平台主要面向智能电网、金融市场实时分析等超大规模运算应用。在发布后的一系列测试中(详见这里),Power 7为我们带来的不止是性能上的震撼,更蕴含着IBM对小型机应用和面向未来的思考。
笔者认为,Power 7作为IBM蓄势两年多推出的新一代Power小型机处理器,极大程度的维护了小型机在当前x86服务器冲击下的高端地位——不论从计算性能还是能效上相比,最高端的x86处理器仍然和Power 7有所差距。而相比之下的SPARC系列小型机处理器以及安腾系列的声势就要比Power 7小很多了。这也从侧面表明了IBM在传统小型机领域的愈发壮大和强势。但由于x86市场的成长和日益强大,小型机市场仍然在不可避免的萎缩,这可能是Power 7未来要面对的主要问题——是放下颜面进入中高端市场,还是继续死守自己的领地。
对Power7处理器更多技术细节感兴趣的读者请点击这里,对Power 7中蕴含的四大技术有兴趣的读者请点击这里。
处理器二:英特尔安腾9300系列
在屡屡推迟之后,英特尔今天终于发布了代号“Tukwila”的首批四核心安腾处理器,命名为安腾9300系列,由于采用的是IA-64架构,面向关键业务领域,因此安腾一直被看做是传统RISC小型机平台的替代者之一。
安腾9300采用65nm工艺,集成多达20亿个晶体管,包括最多24MB三级缓存,支持业界标准DDR3内存,号称互连带宽提升最多800%、内存带宽提升最多500%、内存容量提升最多700%。但是业界对于安腾9300的迟到也有不同看法:一方面英特尔自家的x86架构至强7500在计算能力和RAS特性上均以赶上小型机处理器,另一方面由于迟到,安腾的规格在关键业务领域已经较难与Power 7为首的小型机竞争。
笔者从2008年春季IDF看到安腾9300实物开始,就一直不解于其为何延迟发布,英特尔方面也以调优或内核方面晒除BUG等为由推迟发布时间。时隔两年,英雄迟暮,安腾9300从工艺到规格都已落后于Power太多,IA-64架构试图在高端小型机市场另辟蹊径的做法也步履艰难。期待未来32nm架构的新安腾能振作起来。
对于安腾具体规格和型号感兴趣的读者请点击这里,对于安腾在关键业务领域成长趋势的分析请点击这里。
处理器三:英特尔至强5600系列
3月中旬英特尔发布了32nm工艺六核至强5600系列处理器(代号Westmere-EP),作为首批采用32nm工艺的处理器,除了比至强5500多继承两个内核外,其性能相比上一代也提升了60%,并且可以从至强5500平台无缝升级。
至强5600系列处理器主要用于双路服务器和工作站系统,可为分布于不同行业和专注于不同应用领域的用户带来更加出色的计算性能及能效,尤其适用于大规模数据中心、高性能计算、云计算和其他数据密集型应用环境,可在这些环境中帮助用户提高工作效率,同时解决他们在服务器部署、应用及维护中面临的问题和挑战。[发布会专题]
笔者对于这款处理器没有什么特殊的评论。只有六个字:“先进,高效,主流”。顶尖工艺,6核12线程,支持至强5500平台无缝升级这三大关键词都可以说是至强5600在2010年的成功法门——合作伙伴的大量新品服务器和相关应用案例也证实了这一点。
对于至强5600具体规格和性能测试感兴趣的读者请点击这里,对于至强5600相关案例和应用导购有兴趣的读者请点击这里。
处理器四:英特尔至强7500系列
3月31日,英特尔正式发布了基于Nehalem-EX架构的至强7500处理器,其最高8核16线程的超高性能将x86平台推到了一个新的巅峰(详情请见:至强7500发布专题)。
与上一代面向四路以上平台的六核至强7400处理器相比,虽然仍然使用45纳米工艺,但至强7500的架构发生了重大变革,包括:1)使用QPI总线,取代前端总线架构,最多拥有4条QPI Link;2)集成DDR3内存控制器,有4个内存通道接口,通过设置外置缓冲芯片,每处理器还可最多支持16条内存;3)拥有8个内核;4)采用超线程技术,每CPU可实现16个线程并行;5)23亿个晶体管,L3缓存由16MB提升到24MB。光看这些规格数据就让人咋舌,据称其数据库性能最高可以达到3倍。
至强7500在笔者看来是x86架构处理器的里程碑之作,也是Nehalem架构的终极版本——8核16线程,每内核均为单跳直连,超高容量内存支持,第一次加入众多RAS特性。这几个关键词足以让至强7500黄袍加身——当今最强x86处理器。也宣告了英特尔对四路乃至八路高端市场,乃至用x86架构去冲击小型机市场的野心。
想更多了解至强7500架构处理器详细规格和主要提升的读者请点击这里,而为什么说至强7500对传统RISC架构小型机平台构成了冲击,请点击这里。
处理器五:AMD皓龙6100系列
4月19日,AMD在中国发布了皓龙6100系列处理器(代号:马尼库尔)。作为首款基于直连架构2.0的AMD处理器,皓龙6100拥有8核与12核两个版本,主要面向双路高端服务器市场和四路市场。[发布会专题]
AMD皓龙6100系列处理器与上一代皓龙“伊斯坦布尔”相比核心数量翻番,也是业内第一个达到了12个物理内核的CPU处理器。此外,皓龙6100采用的第二代直连架构不但支持了四通道DDR3内存,而且其HT超传输总线的速率也提升到了6.4GT/s。
笔者认为,作为业内第一款超过10核心的x86处理器,皓龙6100具有里程碑的意义。虽然由于其实质是封装了两个六核DIE,并且性能上并没有成为业界之最,但是AMD即由这款处理器积累的技术和时间——注意,时间很关键,AMD今年主要靠这款处理器获得市场认可(另一款皓龙4100见下页)。从而让AMD在2011年将推出的“推土机”架构处理器得以正面迎击英特尔Sandy-Bridge架构至强处理器。
想了解皓龙6100具体规格特性的读者请点击这里,想了解更多处理器细节以及应用领域的读者请点击这里。
处理器六:AMD皓龙4100系列
6月末AMD发布了45nm工艺六核皓龙4100系列处理器(代号:里斯本),是业内第一个专为云计算、超大规模数据中心以及寻求高度灵活性、可靠性和高能效单路和双路系统的中小型企业客户量身定制的服务器平台。
与六核“伊斯坦布尔”相比,皓龙4100采用了改进后的45nm工艺制造,并且与皓龙6100一样拥有第二代直连架构,并支持双通道DDR3内存,平均功耗最高只有75瓦,比上一代降低24%。
笔者认为,皓龙4100最具意义的地方在于是第一款主打云计算服务器市场的处理器。其性能、内存支持以及高能效几乎是为云计算数据中心量身打造的——由此可见AMD对于用户市场的把握,以及在产品设计时的大胆施为。
想了解皓龙4100具体规格和产品型号的读者请点击这里,想了解更多关于该平台信息的读者请点击这里。
处理器七:Nvidia Fermi架构Tesla
去年末,Nvidia发布了全新架构GPU核心(代号Fermi),并推出了相关显卡,而去年底宣布的Fermi架构Tesla产品则到今年年初才推出产品。实际发布的Tesla产品拥有15组SMI阵列,每组32个流处理器(Nvidia称之为CUDA核心),总共448个,其双精度浮点性能可达630GFlops。
Fermi架构虽然比预计迟到了半年到来,但是其内核革命性的颠覆以往GPU内核格局进而拥有L1和L2缓存,并加入ECC效验机制和支持新一代CUDA都让Fermi架构GPU拥有了更强的通用计算实力。在今年最新的Top500排行榜前十名中有三套超级计算机使用了Fermi核心的GPU做计算加速,其中包括了第一名的“天河一号”。
想了解Fermi核心架构的读者请点击这里,想了解相关计算卡规格和信息的读者请点击这里,想了解“天河一号”中GPU规格的读者请点击这里,想了解Fermi架构Tesla计算卡评测性能的读者请点击这里。
处理器八:Oracle/SUN SPARC T3系列
在9月底的Oracle Open World 2010大会上,Oracle发布了自收购Sun公司之后的第一款处理器SPARC T3系列,拥有16核心128线程,同时推出了四款基于该处理器的服务器系统。
那么,跟上一代T2处理器相比,T3带来了哪些性能上的改进呢?据介绍,T3基本上可以看作是在单一芯片上集成了2个T2+处理器,因此,T3拥有两倍于T2或T2+的内核数(16个),两倍于T2+的万兆以太网接口(2个),两倍于T2或T2+的加密加速内核(16个),每个加密内核的加密算法得到大大改进,比上一代DDR2更快的DDR3内存接口,两倍的系统吞吐量,两倍的内存容量,四倍的I/O吞吐量。这些使得T3能够实现相对于T2+两倍的性能提升。
笔者认为,T3的发布至少延迟了一两年时间,致使许多Sun的客户转移到了IBM或HP的平台上去,甚至有一些T1和T2的用户转向了x86架构。但此次Oracle整合Sun的硬件平台力量,通过对数据库系统的优化力推其处理器和服务器系统也不失为一种策略。
想了解Oracle SPARC T3处理器规格细节的读者请点击这里,对于SPARC T3推出的系列服务器对于用户市场的影响请点击这里。
处理器九:ARM架构处理器
2010年,手机芯片巨头ARM公司一方面凭借苹果iphone、ipad以及Android系统的诸多手机大红大紫。另一方面,也在其ARM处理器架构中做了很多改动,进而让人看到其处理器挑战传统CPU的野心。5月份,戴尔宣布开始测试基于ARM架构的低功耗服务器(见这里),而著名SNS社交网站Facebook也于8月宣布在新数据中心中使用ARM架构服务器取代传统x86系统(见这里)。
9月9日ARM公布了下一代芯片设计Cortex-A15 MPCore(代号Eagle,即老鹰),预计性能比当前高端智能手机高5倍,采用32纳米和28纳米工艺生产,可以制作双核、四核、8核、甚至16核的处理器,每一个内核的速度是2.5GHz。从规格上已经不弱于当今任何一款x86处理器。(见这里)
笔者认为,ARM处理器相比传统x86架构处理器的优势在于超低功耗和高执行效率。但不足之处在于其生态系统还普遍在手机等移动终端领域,并不如x86生态圈那么开放。此外,ARM架构由于是RISC架构的一种,因而在程序开发上存在难度。对旧有x86系统和程序兼容性差乃至不兼容的问题是阻碍ARM接管x86世界的重要壁垒。
想了解更多关于ARM处理器的新规格信息请点击这里,想了解ARM架构与x86处理器的竞争关系和各自优势请点击这里。
处理器十:凌动E600系列
11月末,英特尔发布了面向嵌入式领域的凌动E600处理器,主要瞄准细分市场,包括车载信息系统(IVI),多媒体电话,打印机,数字安全监控,工业自动化等领域的产品和开发商。目前在这些领域中已经有超过3000多项设计规划,1000多项设计中标,并有超过200万的发运量。[相关专题]
笔者认为,凌动E600拥有三方面优势:1、x86架构嵌入式处理器为开发带来了便利;2、超低功耗处理器——最低只有2.7瓦;3、片内集成了开放接口(PCI-E)为扩展带来了无限可能。
想了解关于嵌入式凌动的更多新特性请点击这里,想了解用户如何评论凌动E600请点击这里。
以下是处理器领域相关大事时间表:
2月10日,IBM发布45nm八核Power 7处理器,4.1Ghz主频,八核32线程使得Power 7成为RISC架构处理器王者。
2月10日,英特尔发布65nm四核安腾9300系列处理器(代号Tukwila),相比上一代产品在某些方面有超过500%~800%的性能提升。
2月13日,英特尔发布面向存储和通讯等领域的嵌入式至强C5500/C3500系列处理器(代号Jasper Forest)。
3月15日,英特尔发布32nm工艺六核至强5600系列处理器(代号Westmere-EP,面向双路以下主流应用领域)。
3月31日,英特尔发布45nm工艺八核至强7500系列处理器(代号Nehalem-EX,面向四路以上应用领域)。
4月19日,AMD发布12核皓龙6100系列处理器(代号“Magny-Cours”,面向双路以上应用领域)
5月31日,英特尔宣布将推出集成众核架构(MIC)产品,首批样品代号Knights Ferry,仅用于研究。
6月24日,AMD推出新一代皓龙4000系列处理器,也是业内第一个专为云计算、超大规模数据中心以及寻求高度灵活性、可靠性和高能效单路和双路系统的中小型企业客户量身定制的服务器平台。
8月20日,Nvidia发布基于Fermi新架构的新系列Quadro专业显卡,包括Quadro Plex 7000、Quadro FX 6000、Quadro FX 5000、Quadro FX 4000和Quadro FX 5000M在内的5款新品。
8月26日,ARM正式进军服务器市场,推出ARM架构服务器处理器,并被Facebook部分采纳。
9月29日,在Oracle Openworld大会上,Oracle发布了其在收购Sun公司后的第一款处理器:拥有16核心、128线程的SPARC T3。
11月9日,Marvell发布全球首款四核ARM架构处理器。
11月23日,英特尔发布嵌入式凌动处理器E600系列,口号“开放接口催生应用无限”。
云计算服务器等定制化领域热点事件回顾
云计算作为时下正火的IT理念,其技术和产品牵扯到了服务器、存储、网络、数据中心乃至软件管理,虚拟化,操作系统等各个层面。回首2010年,我们看到芯厂商、服务器厂商在云计算领域推出了针对性产品。
产品一:戴尔C系列云计算服务器
戴尔C系列服务器是年初专门针对超大规模云计算环境精心设计的兼顾性能与效率的服务器。在戴尔看来,当前的大型数据中心,尤其是一些大型网站,采用的服务器基本是定制的。它们的特点是:用途明确,结构简单,性能和效益比较高。
C系列服务器主要拥有三类机型:C1100具备高内存和低功耗,是一款专为集群优化的计算节点服务器;C2100具有非常高的存储扩展空间,是一款高度支持高性能数据分析的云计算平台和云存储服务器;C6100在2U空间里支持4路处理器,是专为云和集群优化的4节点共享型基础设施服务器。
笔者认为,戴尔长期以来坚持的为用户定制服务器和数据中心的策略在云计算时代终于积淀出了光环。凭借对客户数据中心的理解与独有的定制化经验,打造出C系列这样一款面向云计算环境的独特服务器也就不奇怪了。
想了解关于戴尔C系列服务器产品细节的读者,请点击这里。
产品二:戴尔Viking超高密度系统
9月,戴尔推出了代号为Viking(海盗)的3U服务器,该系统由12个名为“Sleds”、类似刀片的模块组成。据称只为全球大约30家拥有超大规模数据中心/云计算中心的企业而设计。
Viking系列超高密度服务器在3U空间内安装了12片名为“Sleds”的类刀片,而每个“Sleds” 模块采用1颗英特尔四核至强3400处理器,另外还有4条DDR3插槽。据称跟12台普通1U服务器相比,装满12个模块的Viking在散热电力上可以节省50%,风扇数量少80%。
笔者认为,这种模块化的高密度“类刀片”满足了企业既追求刀片服务器密度,又碍于机房供电、散热等方面改造困难,寻求到了一个用户能接受的中间点。而作为高密度计算系统,Viking还保持了传统机架服务器的一些特征,在易用性上和管理性上也提供了方便。
想了解更多关于Viking超高密度服务器细节的读者,请点击这里。
产品三:惠普SL390s G7超高密度系统
惠普于2010年秋推出SL可扩展系统的最新服务器SL390s G7,可以在4U机箱里最多可放入8个1U双路节点,支持主流的至强5600处理器和NVIDIA GPU。
SL390s G7有两种机型,其中,1U半宽的版本主要针对通用高密度计算,就是上述的可以加入8个双路计算节点,使4U空间计算密度增加一倍。而另一种2U半宽版本则针对专门需要GPU计算的用户,如科学计算模拟,不仅支持两颗CPU,还支持3块最新的NVIDIA Fermi GPU处理器,从而实现CPU+GPU的异构并行协同计算。
笔者认为,SL390s G7系列极大的彰显了惠普主导的“超可扩展”理念,两个版本分别适用于对计算密度敏感的应用以及时下开始愈发流行的GPU计算。最新一期Top500榜单中的日本东京工业大学TSUBAME 2.0即使用了这款系统的GPU版本,排名第四。
想了解更多关于SL390s G7系统的读者,请点击这里。
产品四:浪潮天梭TS850高端容错服务器
随着4月中旬国家863计划“高端容错计算机”战略论坛的召开。以浪潮为代表的企业提出了“高端容错计算机将主导云计算时代话语权”的理念。与传统认知上云计算服务器是由“廉价中低端”的服务器通过集群虚拟化实现计算资源池的想法不同,新理念更看重云计算环境中的稳定性与容错性能,进而保证云计算的“可靠”与“安全”。[详见专题]
浪潮天梭TS850是一款八路容错服务器。系统内可最大支持8颗英特尔至强7500系列处理器, 9个PCI-E接口,18块2.5寸硬盘。作为信息化战略重要装备和云计算核心服务平台,天梭TS850定位于银行交易结算、证券定价交易、电力调度、民航空管、超级计算中心、人类基因组计划等关键应用。
笔者认为,与目前相对火热的“云计算”理念相比,浪潮的“高端容错”服务器是对云计算业务需求的一种冷静——从用户的需求出发,逆向分析云计算环境中的关键因素,进而推出了“高端容错”产品,也是国内屈指可数的八路“高可靠”、“高可扩展”服务器产品之一。
想了解高端容错服务器和高性能计算机的区别,请点击这里。想了解浪潮TS850高端容错服务器产品细节的读者,请点击这里。
产品五:曙光TC3600刀片服务器
2010年6月份,曙光发布了基于TC3600模块式刀片系统的超级计算机“星云”,并在6月份的Top500中获得第二名(年底top500排名第三)。[详见专题]
曙光TC3600是基于SSI标准打造的模块化刀片服务器,10U机箱内最多可支持 10 个支持Intel 四核或六核CPU的计算刀片混插。此外,TC3600还提供了强大而又灵活的网络和IO扩展能力,用户可通过IO Blade实现IO扩展,为计算刀片提供更多的磁盘和标准PCI-E接口。
与TC2600刀片机箱相比,TC3600由于采用了SSI标准打造,因而具有独立的管控模块和电源冗余——真正将可靠性做到了节点内。TC3600的模块化安装与维护也极大的方便了用户部署。
笔者认为,曙光TC3600是本年度最具特色的刀片服务器之一。不论是国内第一个采用SSI标准的刀片服务器,还是曙光在其上融合HPCSC双重标准,都打破了服务器厂商间互相割裂的“孤岛”局面未用户提供了更多产品选型空间。
想了解更多关于TC3600刀片服务器细节的读者,请点击这里。想了解基于TC3600刀片服务器打造的超级计算机“星云”的读者,请点击这里。
产品六: 英特尔至强5600处理器
3月中旬英特尔发布了32nm工艺六核至强5600系列处理器(代号Westmere-EP),作为首批采用32nm工艺的处理器,除了比至强5500多继承两个内核外,其性能相比上一代也提升了60%,并且可以从至强5500平台无缝升级。
至强5600系列处理器主要用于双路服务器和工作站系统,可为分布于不同行业和专注于不同应用领域的用户带来更加出色的计算性能及能效,尤其适用于大规模数据中心、高性能计算、云计算和其他数据密集型应用环境,可在这些环境中帮助用户提高工作效率,同时解决他们在服务器部署、应用及维护中面临的问题和挑战。[发布会专题]
笔者对于这款处理器没有什么特殊的评论。只有六个字:“先进,高效,主流”。顶尖工艺,6核12线程,支持至强5500平台无缝升级这三大关键词都可以说是至强5600在2010年的成功法门——合作伙伴的大量新品服务器和相关应用案例也证实了至强5600在双路领域的强悍(云计算环境目前普遍使用双路服务器)。
对于至强5600具体规格和性能测试感兴趣的读者请点击这里,对于至强5600相关案例和应用导购有兴趣的读者请点击这里。
产品七:AMD皓龙4100处理器
6月末AMD发布了45nm工艺六核皓龙4100系列处理器(代号:里斯本),是业内第一个专为云计算、超大规模数据中心以及寻求高度灵活性、可靠性和高能效单路和双路系统的中小型企业客户量身定制的服务器平台。
与六核“伊斯坦布尔”相比,皓龙4100采用了改进后的45nm工艺制造,并且与皓龙6100一样拥有第二代直连架构,并支持双通道DDR3内存,平均功耗最高只有75瓦,比上一代降低24%。
笔者认为,皓龙4100最具意义的地方在于是第一款主打云计算服务器市场的处理器。其性能、内存支持以及高能效几乎是为云计算数据中心量身打造的——由此可见AMD对于用户市场的把握,以及在产品设计时的大胆施为。
想了解皓龙4100具体规格和产品型号的读者请点击这里,想了解更多关于该平台信息的读者请点击这里。
以下是云计算服务器领域大事时间表:
7月7日,曙光与北京计算中心达成合作,共同联手建设“北京市计算中心&曙光 云计算联合实验室”(以下简称:云计算联合实验室)。
8月28日,IBM在成都举行了主题为“风起云涌聚英杰,双雄合壁胜乾坤”2010年Power 应用开发商大会。
9月3日,IBM在四川成都召开了“2010年IBM虚拟化与云计算高峰论坛”,主题——智慧虚拟行 畅享云起时。
10月18日,北京计算中心建成国内最大的工业云平台。
10月28日,英特尔宣布了2015年云愿景及相关计划,包括“互通性、自动化与终端设备自适应”。
12月1日~3日,TechED2010微软宣布启动云的力量,全面扑向云计算。
RISC小型机/大型机领域热点事件回顾
2010年对于服务器领域来说是非常重要的一年,除了x86服务器如火如荼的伴随着大量处理器发布进而衍生出大量新品外,小型机领域也相继推出了基于新处理器平台的产品。本期我们将继续回顾2010年的新品——盘点基于Power 7、安腾9300和Orcale的新型小型机产品,以及较为特殊的大型机系统。
小型机一:IBM Power 7系列
随着2月份IBM发布Power 7系列处理器,并紧接着连推四款基于Power 7的四款产品:Power 750 Express、Power 755、Power 770和 Power 780。其中,Power 750 Express主要面向商业应用,而Power755主要针对高性能计算。Power 770和 Power 780的定位更加高端。想进一步了解Power 7系列服务器的读者,可以点击这里查看专题。
▲IBM Power 7服务器
跟我们常见的一些PC服务器不同,POWER7的处理器并不是直接插在主板上的,而是与内存一起做成一块处理器卡,然后再插在主板上。比如Power 750 Express就可以插1-4块这样的POWER7处理器卡,卡上带8根DDR3内存插槽。而Power 755由于定位为高性能计算节点,因此配置上比Power 750 Express更高,会插满4块POWER7处理器卡,每颗处理器带有8个3.3 GHz的内核,而不象Power 750 Express有6核、8核、不同主频等多个版本选择。请点击这里查看Power 7系列服务器图解。
在过去的四年半时间里,超过2600个客户将期UNIX系统迁移到了IBM的Power平台上。随着POWER7在今年初推向市场,凭借无可比拟的性能优势,更是加快了这一进程。据统计,仅2010年上半年,就已经有500多个客户迁移到了IBM平台上来。想查看Power 7系列服务器评测的读者,请点击这里。
笔者认为,Power 7系列服务器继承了Power系列产品的一贯优势,用三个词形容就是:“高端、硬朗、专业”。RISC架构Power 7处理器的强大计算性能使得Power 7相比上一代小型机产品产品拥有将近3倍的性能提升。
想了解关于Power 7系列服务器的最新信息,请点击这里查看Power中国用户组。
小型机二:英特尔安腾9300系列
年初和IBM Power 7几乎同一时间发布的英特尔安腾9300系列处理器(代号:Tukwila)(请点击这里查看细节)。由于迟到了两年,让人总有些惋惜。这款芯片的亮点在于增加了高速的互连和支持DDR3内存等新技术,而其三个级别缓存都是采用的单核心独占的方式,每一个核心拥有16K的一级指令缓存和16K的一级数据缓存、512K的二级指令缓存和512K的二级数据缓存、另外还有6M的三级缓存,总的片上缓存在30M左右。
▲惠普动能服务器
处理器规格放在两年前是绝对强势的产品,而如今与IBM Power 7一比较就有些尴尬。不过对于英特尔的IA-64架构来说,能推出如此性能的产品无疑对市场是一剂安慰。
宝德3月初率先在国内推出了基于安腾9300系列处理器的服务器产品Powerscale 5000系列,支持2~32颗CPU处理器,涵盖中端市场,如大学校园级的主控计算机等,以及中高端市场,如商业机构的中高端关键业务计算机。[关注的读者可以点击这里]
而另一个安腾联盟的核心厂商惠普,也在4月末发布了基于新一代安腾芯片的动能系列服务器。惠普新一代动能服务器可靠性提升了近450%,统一的Blade Scale架构也使得动能系列产品交付了100多个关键业务创建,在可靠性方面实现重大突破。特有的Crossbar Fabric通过在刀片和I/O端口之间智能路由数据提高了系统弹性。[关注惠普动能服务器的读者可以点击这里]
笔者认为,时隔两年,英雄迟暮,安腾9300从工艺到规格都已落后于Power7,IA-64架构试图在高端小型机市场另辟蹊径的做法也步履艰难。但来自合作伙伴的支持还将使安腾继续坚持下去,期待未来32nm架构的新安腾能振作起来。
小型机三:Oracle/Sun SPARC T3系列
在9月底的Oracle Open World 2010大会上,Oracle发布了自收购Sun公司之后的第一款处理器SPARC T3系列,拥有16核心128线程,同时推出了四款基于该处理器的服务器系统。
▲Oracle SPARC T3系列服务器
Oracle推出四款采用SPARC T3的T系列服务器,分别是单插槽SPARC T3-1 2U机架服务器、单插槽SPARC T3-1B 刀片服务器、双插槽SPARC T3-2 服务器、四插槽SPARC T3-4服务器。官方宣称其比上一代SPARC T系列服务器的性能提高了2倍,并刷新了9项世界记录,包括一项 SPECj Enterprise2010 的结果。
笔者认为,T3的发布至少延迟了一两年时间,致使许多Sun的客户转移到了IBM或HP的平台上去,甚至有一些T1和T2的用户转向了x86架构。但此次Oracle整合Sun的硬件平台力量,通过对数据库系统的优化力推其处理器和服务器系统也不失为一种策略。
想了解Oracle SPARC T3处理器规格细节的读者请点击这里,对于SPARC T3推出的系列服务器对于用户市场的影响请点击这里。
大型机: IBM zEnterprise系统
7月29日,IBM宣布推出zEnterprise大型主机系统,包含三大部分:IBM zEnterprise 196 (z196)大型机、IBM zEnterprise BladeCenter Extension (zBX)刀片扩展机柜和IBM zEnterprise Unified Resource Manager (Unified Resource Manager,zManager)管理固件。这三部分使得zEnterprise成为第一个横跨System z、特定的Power7和System x三种架构服务器的大型机系统。[相关专题]
▲IBM zEnterprise大型机
新一代的IBM zEnterprise系统不仅在可扩展性、性能、容量、能效等方面有所提升——与z10相同的能耗却换来了60%的更大容量,5.2GHz高主频CPU和80-way扩展架构、新型四级大缓存结构使传统z/OS负载性能提高40%,编译器改进则使得CPU密集型负载性能可提高30%,内存容量翻倍更适合商业分析与决策支持应用,专门工作负载优化器使复杂数据库查询性能可以提高5-10倍,浮点计算性能和单线程性能也更强;而且更重要的是,zEnterprise给CIO们带来了一种新的管理视角:让前端应用与后端系统资源实现自动优化匹配,简化系统复杂性和数据中心管理成本,让IT人员有更多的时间和精力去为业务做创新。
继三年前上一代大型机之后,zEnterprise耗资15亿美元研发,由5000多位IBM员工耗时3100万小时研发而成,被业界誉为是20年来IBM大型机设计的重大里程碑——将大型机的强大可靠性和安全性特点扩展到额外的系统上。
笔者认为,zEnterprise大型机一方面将大型机的可靠性和绝高性能延续下来,另一方面也突破性的采用了异构设计。相比原先的“一刀切”式的统一将应用跑在大型机或者统一跑在小机、x86服务器上,这种异构大型机的采购和运维成本更低,且系统化的异构设计最大限度的提升了多系统间的通讯与计算协调性。
想了解有关大型机研发背景与中国市场策略的读者,请点击这里。想了解有关IBM大型主机相关特性和系统构成特点的读者,请点击这里。
以下是小型机/大型机领域大事时间表:
2月10日,英特尔发布65nm四核安腾9300系列处理器(代号Tukwila),相比上一代产品在某些方面有超过500%~800%的性能提升。
2月21日,IBM发布基于Power7处理器的四款全新Power System系列服务器,包括Power 780,Power770,Power 750和Power755。
2月10日,IBM发布45nm八核Power 7处理器,4.1Ghz主频,八核32线程使得Power 7成为RISC架构处理器王者。
3月4日,宝德推出基于安腾9300系列处理器的小型机,并将之前的Power Scale 4000,5000,6000三系列产品,升级合并成为一条Powerscale5000系列产品线。
4月27日,惠普推出基于安腾9300处理器的动能系列服务器。
3月12日,IBM举行2010年Power Systems成长型企业用户大会,探讨了在智慧的地球愿景下,新的应用趋势和市场发展方向。
3月16日,IBM召开2010 Power Start合作伙伴峰会,探讨如何利用Power 7优化工作负载。
4月8日,IBM在上海召开主题为“芯动天下 共赢未来”的2010 Power Start合作伙伴峰会。
4月21日,IBM推出基于Power 7刀片服务器,还推出AIX低端版本面向小型企业和整合项目的大企业。
5月21日,IBM在云南召开2010 IWorld用户论坛,同i客户和合作伙伴就如何充分利用POWER7的领先科技,实现更快业务成长而进行的一次深入交流。
7月29日,IBM宣布推出zEnterprise大型主机和一个全新设计的系统,该系统能够允许大型主机、POWER7和System x 服务器上的工作负载共享资源,并作为一个单一的、虚拟的系统进行管理。
刀片服务器领域热点事件回顾
由于云计算数据中心的兴起,刀片服务器因为密度高,占用空间少而越来越受到青睐。2010年服务器市场可谓风起云涌,除了传统意义上的刀片服务器更新,还涌现了包括国产龙芯刀片和惠普SL高可扩展性系统等“类刀片”服务器。我们将在本文中盘点过去一年中推出的众多新刀片及其特色技术。
1、IBM x5架构独门刀片HX5
借助IBM第五代X架构技术(eX5),HX5刀片服务器不仅支持最新的英特尔至强处理器(至强6500、至强7500),而且还在很多方面超越了行业标准,提高了内存和虚拟化支持。
单个HX5刀片为双插槽服务器,最多配置2颗处理器。其支持的英特尔至强7500或6500处理器可以是4核、6核或者8核,最高主频为2.66GHz。单片HX5宽度为30毫米,拥有16个DDR-3 VLP DIMM插槽。每台刀片服务器共有8个I/O 端口(包括4个高速I/O端口),配备1个CIOv插槽(标准 PCI-e 子卡)和1个CFFh插槽(高速 PCI-e 子卡)。存储方面,HX5拥有2非热插拔托架,支持固态驱动器(最多100GB)。HX5还带有双千兆以太网端口的Broadcom 5709S板载网卡,支持TOE。
可扩展的刀片服务器,让您在同一个平台上同时满足双路和四路处理器的需求,实施标准化管理以便加快创收,同时在高密度环境中提供非常好的性能和最高效率。
MAX5是介绍HX5时不得不说的技术。因为借助IBM MAX5内存扩展技术,HX5刀片服务器可提供高达640GB的内存容量。内存扩展后的好处就是,通过在每个系统上提供更多虚拟机以及更大,更快的数据库,实现了非常好的服务器利用率。
MAX5是IBM对X86服务器架构进行的大胆创新,它将内存从传统的与服务器处理器紧密捆绑的局限位置中解脱出来,让内存的扩展可以独立于处理器。MAX5的关键技术就是eX5芯片,其中包含内存控制器和探听过滤器。MAX5内存扩展带来的好处是显而易见的:无需增加处理器即可以增加内存,从而节省处理器和软件许可成本;更多DIMM插槽,可混合使用并匹配更小、更便宜的DIMM,从而降低系统成本。
2、国产里程碑:曙光龙芯刀片
曙光公司于4月份宣布研制成功龙芯刀片服务器,这标志着国产处理器首次应用在了高密度刀片产品中,也是首次应用在高性能计算领域。正如龙芯总设计师胡伟武在曙光龙芯刀片服务器发布现场所言,“我最早认为龙芯是一个项目,后来认为这是一个产品,现在才发现龙芯其实是一个产业链。”风雨八年,龙芯之路,并不平坦!
龙芯系列处理器发展到现在即将有三大路线图,分别是面向服务器和高性能计算领域的“大CPU”龙芯3A(龙芯刀片),未来曙光6000将采用的龙芯3B处理器(8核心);另一条路线则是面向普通计算机和嵌入式应用的龙芯2系列处理器,已经发展到了龙芯2F和龙芯2G;最后一条产品线是面向移动和消费电子的嵌入式龙芯1系列处理器。
笔者认为,相比国外主流x86厂商在制程和主频工艺等领域疯狂攀升性能,龙芯走了另一条路(MIPS架构),并且在多核心封装方面具有x86所不具备的优势。未来的曙光6000将成为国内超算首次使用国产处理器的里程碑,意义空前。
IT168服务器频道梳理了龙芯刀片发布的台前幕后,并对龙芯刀片服务器产品做了详细的图文解读,感兴趣的读者可以点击这里。
3、国产SSI标准刀片:曙光TC3600
2010年6月份,曙光发布了基于TC3600模块式刀片系统的超级计算机“星云”,并在6月份的Top500中获得第二名(年底top500排名第三)。[详见专题]
曙光TC3600是基于SSI标准打造的模块化刀片服务器,10U机箱内最多可支持 10 个支持Intel 四核或六核CPU的计算刀片混插。此外,TC3600还提供了强大而又灵活的网络和IO扩展能力,用户可通过IO Blade实现IO扩展,为计算刀片提供更多的磁盘和标准PCI-E接口。
TC3600刀片服务器以高性能计算、Web基础架构、虚拟化为主要应用目标,融入了诸多先进的设计理念和技术特性,是业界领先的最新一代符合开放性标准的刀片服务器产品。它拥有10个计算刀片,并且拥有曙光自行研发的弹性存储模块,最大单刀片可以使用12块2.5寸硬盘,并且拥有4个大功率冗余电源,支持N+1和N+N等方式冗余。此外,TC3600的背板设计很独特,拥有灵活的I/O刀片,可以插入10片存储模块(共20个2.5寸硬盘)或10个PCI-E扩展设备。网络交换方面,TC3600拥有两个低速模块,并支持DDR和QDR全速的Infiniband交换模块,使得最高吞吐量可以达到2.88Tb/s。
笔者认为,曙光TC3600是本年度最具特色的刀片服务器之一。不论是国内第一个采用SSI标准的刀片服务器,还是曙光在其上融合HPCSC双重标准,都打破了服务器厂商间互相割裂的“孤岛”局面未用户提供了更多产品选型空间。
想了解更多关于TC3600刀片服务器细节的读者,请点击这里。想了解基于TC3600刀片服务器打造的超级计算机“星云”的读者,请点击这里。
4、惠普SL系列“类刀片”产品
惠普于2010年秋推出SL可扩展系统的最新服务器SL390s G7,可以在4U机箱里最多可放入8个1U双路节点,支持主流的至强5600处理器和NVIDIA GPU。
SL390s G7有两种机型,其中,1U半宽的版本主要针对通用高密度计算,就是上述的可以加入8个双路计算节点,使4U空间计算密度增加一倍。而另一种2U半宽版本则针对专门需要GPU计算的用户,如科学计算模拟,不仅支持两颗CPU,还支持3块最新的NVIDIA Fermi GPU处理器,从而实现CPU+GPU的异构并行协同计算。
笔者认为,SL390s G7系列极大的彰显了惠普主导的“超可扩展”理念,两个版本分别适用于对计算密度敏感的应用以及时下开始愈发流行的GPU计算。最新一期Top500榜单中的日本东京工业大学TSUBAME 2.0即使用了这款系统的GPU版本,排名第四。
想了解更多关于SL390s G7系统的读者,请点击这里。
以下是刀片服务器领域大事时间表:
2月21日,IBM推出HS22v刀片服务器,配置了惊人的18根DDR3内存插槽,使其最大内存可达144GB内存容量。
3月3日,IBM发布新一代x86服务器eX5体系架构 ,并推出了四款新品:4路服务器System x3850 X5、双路服务器System x3690 X5和刀片服务器BladeCenter HX5。
3月24日,曙光推出CB60刀片服务器的G系列刀片,具备高性能和高可扩展能力。
4月23日,曙光宣布成功研制出基于国产龙芯处理器的高性能刀片服务器CB50-A。
4月21日,IBM推出基于Power 7刀片服务器,还推出AIX低端版本面向小型企业和整合项目的大企业。
服务器操作系统热点事件回顾 今年Linux方面的重大发布要数Ubuntu 10.10(详见这里),Canonical之前承诺的很多新功能也都在Ubuntu10.10中实现了——特别是优化了云计算功能Ubuntu One和软件中心。 另一方面,微软针对高性能计算系统发布了新一代“Windows HPC Server 2008 R2 Suite”(详见这里)。通过Windows HPC Server,用户拥有一个端到端的高性能计算平台,无需花更多时间和金钱用以整合多种技术。 下面是服务器操作系统大事时间表: 4月29日,著名开源Linux系统Ubuntu 10.04正式发布。 10月10日,Ubuntu 10.10正式发布 7月26日,微软发布新一代高性能计算(HPC)集群专用系统“Windows HPC Server 2008 R2 Suite”。