服务器 频道

见证风起云涌 回顾报道中的感悟

    【IT168 专稿】大二时的某个缘起,成为了IT168服务器频道的作者,校园生活伴随着对前沿技术的学习和整理,眼界也逐渐开阔。当时的企业级市场,四核风暴刚刚开始席卷人们的视野,真假四核闹得正凶,AM2架构横空出世,刀片已经兴起,虚拟化还停留在宣传阶段,云计算虚无缥缈……

    转眼之间,已经成为IT168服务器频道的正式编辑一年有余,值此IT168十周岁生日之际,献上我个人报道中的趣事和工作中的杂感,以为纪念。

    枝繁叶茂需要扎实谦逊的根系

    首先值得一说的是IDF,英特尔的信息技术峰会通常每年会在国内办一次。我第一次参加全程报道是在2008年,那会儿还没毕业。4月份,上海不热,是时还没有经济危机的阴影,IDF峰会办的很宏大。技术报道这里不谈,有兴趣的朋友可以看我们的专题,内容很全(地址:2008年春季IDF报道)。

    这里想说的是一个小插曲,除了主会场以外,IDF还有不少技术讲座,其中不乏英特尔高级技术人员亲自授课。在Quick Assist课程中,我发现讲师是英特尔数字企业事业部的首席工程师Neal Oliver先生。他亲自主持了Quick Assist中主要模块的设计工作。这里有必要简述一下Quick Assist技术是英特尔优化服务器计算性能的一种加速器,可以看做是协处理器,我至今仍然可以清楚的记得应用了该技术的FPGA模块在某专业计算中速度超过传统CPU运算速度230多倍。

    如果说专业的精神,说到自己设计的FPGA模块时的自豪足以传递创新激情的话,那么在接受采访时的谦虚态度和低调的凝听则宣扬了一种从容不迫的修养--也使我深刻感受到技术创新所需要的人才应具备什么样的素质--华丽如英特尔,也仍然保持着谦逊扎实的精神。(详见:IDF博客:It is my honor

英特尔数字企业事业部首席工程师Neal Oliver先生

   鉴证国内高性能计算的飞跃

    从08年8月份曙光5000A超级计算机正式生产完毕下线以来,这台每秒200万次的机器就成为国内高性能计算的标杆产品。在针对5000A的一系列报道中,印象最深刻的要数独家揭秘曙光5000A在中科院超算所的安装现场了(详见:IT168独家揭秘曙光5000A安装现场)。

    5000A在中科院计算所地下一层的一个巨大房间中安置着,我带着摄像机去的时候,正赶上微软美国的摄制组在拍摄这台64个机柜的超级计算机。现场与他们沟通了一下,他们来拍摄曙光5000A的目的是为了用作Windows Server 2008的宣传。

    在拍摄间隙,与工程师的沟通中我们知道,曙光5000A在中科院计算所的安装调试工作还兼具着跑linpack测试--到了08年12月,曙光5000A凭借每秒200万亿次的计算能力荣登世界超级计算机排行榜前十名。虽说采用了封闭式内循环风冷、外部水冷散热系统,但是曙光5000A在房间内发出的轰鸣声仍然非常大,以至于我们录制视频时采用的降噪麦克风也仍然可以拍到背景噪音。

    由于每个节点插了10个刀片,每个刀片又是四路,每一路CPU又拥有8G内存,因此我们经常看到有某节点的故障灯亮,然后工程师去卸下某个刀片,更换其中的内存条--在这样的高强度、高密度运算中,内存条非常容易出问题。现场的内存条是成箱成箱的,每条都是4GB容量的超大内存。

未公布的图片:为曙光5000A的某个刀片更换内存(一大盒内存条)

    如果说5000A是超大规模高性能计算的代表,那么PHPC个人高性能计算机就显得更贴近我们生活。最初在发布会上见到它,觉得这就是一个微缩版的机架式服务器。但由于个人高性能计算这个概念国外也是刚刚兴起,因此曙光的PHPC显得颇为前卫,我发起了视频拆解PHPC的策划,邀请曙光技术支持中心高性能计算的首席工程师戴荣博士来到我们IT168演播室,详细解析PHPC的神奇之处。(详见:曙光PHPC个人高性能计算机拆解

    戴荣博士讲得很好,拆解过程也相当顺利。PHPC采用的全模块化设计最大限度的保证了高性能计算的可靠性和便利性。令我印象深刻的是PHPC背部的网络模块,可以根据需要替换infiniband网络或千兆以太网模块等。而PHPC采用的Windows HPC server系统,当时还处于beta版本,其对PHPC中各节点的管理令人对Windows系统产生了耳目一新的感觉--这也更符合PHPC面向个人、实验室和中小企业的定位--相比Unix机器更易于用户操作。

    今年曙光宣布研发计算能力达到每秒千万亿次的超级计算机,并计划采用国产龙芯处理器。虽然龙芯与主流处理器相比单颗并没有优势,但是由于其低功耗和开源基础架构优势,使得在超级计算机这种大规模应用中可获得更高的能效比。期待国内高性能计算可以再自主研发自主创新的道路上攀上更高的台阶。

    "上海""你嗨了么""伊斯坦布尔"

    对于竞争激烈的半导体行业而言,"摩尔定律"被奉为神条。而摩尔定律却没有指出制程工艺与处理器架构之间的更迭关系。于是我们在过去的岁月里看到了AMD凭借x86-64位架构的前瞻性架构,一举在企业级和民用级市场打开了市场。接下来的双核之争,AMD也拔得了头筹。怎奈英特尔卧薪尝胆,陡然推出酷睿架构,凭借高效率的流水线架构又反过来打了个反击战。

    但是企业级市场这面,AMD仍然较强势,凭借性价比和能效比优势,皓龙处理器在高性能计算领域以及一些高密度的互联网应用中确实有领先的地方。这其中英特尔与AMD之间主要因为真假"四核"处理器、制程先进性甚至是良品率产生过口水战,在此也不再赘述。

    话说"上海",这款用F1上海赛道命名的皓龙处理器是AMD第一款45nm制程工艺的四核处理器。说说我自己的观点,我个人认为AMD一直以来都是一个剑客,不走寻常路,剑走偏锋型的。在2007年底英特尔推出45nm制程工艺的至强处理器之后,AMD的巴塞罗那由于还停留在65nm而被诟病高功耗低效率。

AMD上海发布现场放着“老上海”的东西

    而由于AMD在制程上的路线与英特尔并不一样,因而也一直坚持着65nm工艺。一方面,AMD认为还没有必要升级新的工艺而提高成本,另一方面也因为AMD认为新工艺还没有完全成熟。这种策略是AMD从宣传双核处理器中总结到的--让对手来宣传,等市场成熟再跟进。

    于是有了姗姗来迟的45nm"上海",也有了与英特尔基于铪的高K阶金属栅极工艺完全不同的超低K阶电介质材料,并且提早使用了多重增强晶体管应变技术和沉浸式平板应刷术,为AMD未来转向32nm扫清了障碍。(详见:AMD发布上海处理器

    英特尔自从提出"Tick-Tock"的战略之后,就一直严格遵照这个过程推进。2007年到2008年力推45nm工艺,到了2009年开始力推Nehalem(你嗨了么)架构,2010年开始推32nm制程产品。这种快速的更新让人目不暇接的同时,也不禁让人再次感叹英特尔的这种创新能力。

    晚于桌面级Nehalem处理器Core i7的发布,Nehalem至强5500处理器于2009年3月底才发布。(详见:至强5500发布)"一台顶过去九台,、这么强?"这是网友的留言,令我印象深刻。确实,Nehalem架构革命性的改变了英特尔传统的将内存控制器放在北桥的做法,转而集成在了处理器内部。与用于多核之间通讯的QPI直连总线一起作用,Nehalem架构最大限度的提高了自身的I/O速率。

    内存敏感型、带宽敏感型,两类应用在Nehalem架构面前统一在了一起。Core和Uncore两大块设计让产品多样化变得更加容易。笔者自己使用的是桌面级产品Core i7 920,在视频渲染和大型程序应用时,可以明显感到速度的飞升。

手上拿的是Nehalem至强5500的硅晶圆——价值在200万左右

    应对Nehalem的最好方法就是推出更好的新品,AMD于6月初提前发布六核"伊斯坦布尔"的用意也在于此。和"上海"相比,"伊斯坦布尔"最大的变化就是核心数量的提升,并继续提高了"上海"处理器上出现的HT3.0总线的速度。而除了6个核心、双通道DDR2-800集成内存控制器和最多三条HT 3.0总线之外,"伊斯坦布尔"还提供了进化版的AMD-V 2.0,让"伊斯坦布尔"的虚拟化性能再度提升,并加入了新的AMD-P技术来更完美地控制处理器功耗,配合CoolCore和Smart Fetch技术可以限制内核功耗甚至关闭内核。(详见:六核时代 AMD最新伊斯坦布尔处理器解析

    令我为之动容的是AMD本次处理器的更新速度,自上次新品发布仅半年之隔,能推出一款全新架构,并且内核数更多的处理器,充分说明了AMD再拆分了晶圆厂之后的实力。而性能方面,AMD自己宣称:与英特尔至强5570处理器相比,在虚拟化应用时每个虚拟机的平均功耗换算成美元,上一代"上海"处理器要少三分之一。而"伊斯坦布尔"则将取得更高的能效比,在功耗与主频同"上海"一样的情况下,性能提高了34%。(详见:六核皓龙“伊斯坦布尔”台北震撼发布

    云计算下凡 让我们联合起来

    2008年初我们开始关注云计算的时候,国内真正注意到它的还不多。7月中旬,IT168服务器频道做了第一个大型的云计算专题(详见:深入剖析云计算)。事实上,这也是我们现在云计算频道(cloud.it168.com)的雏形。

    学者们和IT企业里的精英们对云计算下过很多定义,很难有相同的观点,但大家普遍认为云计算是未来互联网乃至IT产业结构发展的方向。这说明云计算实际上是个简单而又复杂的概念,简单在它是如此清晰的将灵活、高效、节能几个IT产业如今面临的问题给统一在一起解决掉;复杂在云计算需要从基础架构到中间层、再到操作系统乃至应用服务的支持,而最关键的在于要人们接受云计算的概念,需要花费大量的时间去改造人们已有的意识形态。

    这个改造,计算机普及的时候用了数十年,互联网普及的时候用了数年,云呢?分析师预计今后五年内云计算服务业务将达到420亿美元,从何而来?人们似乎在不经意间正在悄然走向云时代。

    借这机会说下我自己的看法,如前所述,云计算真正整合的,是人们的观念。如果说过去的计算资源像一口口水井,大家自给自足,而现在云计算将他们统一成自来水厂,给大家按需供水;那么,我认为首先我们要信任自来水厂;然后我们要学会从水管子饮水,最后我们需要适应喝水是要给钱的。

    后两点好理解,学会租用云服务,学会租用云存储资源,就是学会拧开水龙头,享受现代化的水源。有人会说,那我已经打好的水井怎么办?这牵扯到解决方案的设计,我只想简单的说:首先,维护旧有设备的资金是否值得需要重新评估;其次,并行应用,水井与自来水都用似乎并不吃亏--尤其是在业务增加或业务迁移的时候。

    喝水要给钱,租用服务按需付费自然义不容辞。云计算的好处就在于你不必为了峰值负载购买一大批设备--根据中国移动通信研究院透露的经验,日常应用的负载很低,而到了节假日,例如春节期间,数据中心的压力会陡然增大,难道要为了这每年一阵子的峰值负载购买很多设备平时空闲着?显然,云计算的按需租用计算资源是非常棒的解决方案。

    最后说信任问题。我们一直以来都认为将数据和资源放在自己身边是安全的,可靠地。而对于租用别人机房和服务器心有疑虑,所以不会将敏感业务放在上面。这是可以理解的合理需求,而云计算恰恰可以提供一个完整的解决方案。举VMware的一个解决方案,他们将云分为内部云和外部云,企业的内部IT架构与外部业务也就自然分开,而中间需要通信的部分利用开放式云协议OVF无缝通讯,第三方却无法访问,从而构成了企业内部的"私有云"。

    当然,云计算还有不少有待解决的问题,如各个云服务商之间的标准化整合--以防单个服务商宕机造成云服务瘫痪。再比如用户的数据保护,灾备等。

    当然,我个人认为,云计算既然已经全面铺开在人们面前--5月22日中国首届云计算论坛刚刚结束(详见:2009中国云计算论坛)。那么媒体的首要责任就是将云计算的各个方面展示在人们面前,而最主要的是推动它的普及--这种使命感也促成了我们云计算频道的成立(详见:专家齐贺云计算频道成立)。

    我们也新推出一个系列节目《云计算百家讲坛》集业界专家学者,从多个角度为网友们梳理云计算的相关技术和话题。第一部的主题是"云山雾罩,缘起何方",意图通过技术进步与和互联网服务等角度发掘催生云计算的需求和动力在哪里。(详见第一集:李严冰:云计算是'三国版'计算模式演变

    IT168迎来十周年生日,我也在这里度过不平凡的一年,见证着IT最前沿的风起云涌。就像云计算的整合资源,动态调配一样,无论是媒体还是网友,实际上都是互联网的一部分。只有我们联合起来,共同关注IT产业的创新、发展,才能最终带动这个互联网向前发展,也真正的变成书写历史的一份子。
 

0
相关文章