【IT168 专稿】说工作负载优化和海量数据处理,肯定让人摸不着头脑,但是如果说到前不久在《危险边缘》(Jeopardy!)智力比赛中完胜人类的超级计算机“沃森”(Watson),大家就耳熟能详了。“沃森”超级计算机没有连接网络,凭借强大的Power 7计算平台和智能算法在后台庞大的知识海洋中分析问题主旨,并筛选出合适的答案——3秒内作答。
那么“沃森”的超前和领先的技术真正含义又在哪里呢?IBM中国研究院的张雷表示,“沃森”的真正挑战在于理解问题的真正含义,正确比对数据库,并且在诸多信息中去伪存真找到正确答案。而这一系列比对数据库,正好与商业计算中的海量数据处理类似,因此“沃森”实际上证明了IBM在海量数据处理中的强大实力——这种实力来自软件算法也来自支撑计算的基础架构平台。
一、四路领域完胜 Power商用计算潜力广阔
从官方公布的数据来看,“沃森”内部使用的的是市面上买得到的90台Power 750四路小型机。也就是说,每台Power 7服务器拥有四个8核Power 7处理器,构成32个计算内核,而“沃森”也就拥有了2880个Power 7计算内核(360个处理器)。在聚合了如此多的处理器之后,“沃森”完胜了人类,那么单独一个Power 7节点的计算水平呢?
在早先的测试中,我们可以看到四路IBM Power 750完胜同类四路对手产品,在一系列浮点计算和面向数据库计算的模拟中Power 750无疑是当前世界上最快的四路服务器。
▲
跟高端系统类似,四路的Power服务器也同样拥有比竞争产品更多的内存、I/O,以更好地支持服务器整合。这主要得益于Power 7自身的四大特性:
1、eDRAM三级缓存带来超高性能
所谓eDRAM顾名思义,就是指嵌入式动态随机存储器(Embedded DRAM),它有两方面的好处。首先是eDRAM本身比目前广泛使用的SRAM缓存具有更高的速度,更高的密度以及更低的功耗。根据IBM的官方数据,eDRAM只需要传统SRAM三分之一的空间,五分之一的功耗就可以获得同样的缓存容量,并将错误几率降低250倍。
eDRAM与逻辑晶体管全兼容,且逻辑性能不会退化。IBM Power 7处理器集成了高达32MB的片上L3级缓存,较片外缓存延迟只有1/6,带宽则提升了两倍。我们知道,处理器执行计算需要依次在L1、L2、L3缓存中查询数据,而缓存越大使得查询"中靶率"越高,Power 7中的32MB L3级缓存可以说将这种思路拓展到了极致。
2、SMT4智能的并发多线程
并发多线程技术(SMT)大家已经不陌生,但是与以往单一物理内核能分出2个逻辑线程并行计算不同,Power 7中的SMT4将每核心的多线程数量从以前的2线程提升至4线程。而且处理器可以智能的根据应用需求在单线程,双线程和4线程之间动态切换自身的线程数量,以获得非常好的应用表现。
所谓智能并发多线程,指的是IBM Power 7不是每颗核心4线程,而是智能的根据应用调整线程数量--在面向繁多的"碎小计算"时转入SMT4模式,8核32线程最大并行计算;而面向大规模单线程计算任务时,转入SMT1模式,8核8线程,最大化的使用每颗内核进行计算。
IBM官方数据显示,当负载能够受益于多线程时,SMT2模式较SMT1提升50%,SMT4模式较SMT1提升80%。
3、Turbo Core模式将全部资源集中
对于"沃森"来说,海量数据的瞬时分析,一方面考验了并行计算特性,另一方面也对线性计算的次序提出了严格要求。也就是说,如果"沃森"通过并行计算检索了很多数据,又如何能进行比对并筛选出答案,进而抢答--这就需要组成"沃森"的"细胞"--Power 7服务器在两种情况下都具有超强性能。
Turbo Core模式最大特点是根据应用负载的变化,自动关闭Power 7八个核心中的四个,将缓存、带宽资源全部分配给剩下的四个核心,并动态提升主频。举个形象的例子,8辆车(8个核心)在高速公路(相当于带宽)上跑,现在退出了4辆车,于是变相等于剩下4辆车的路(带宽)变宽了--而那4辆车的汽油(CPU内供电)也给了剩下的车,于是发动机可以超负荷工作(提升主频)跑的更快了。此外,剩下的4辆车还获得了全部的货物(缓存)。
对于数据库和事务工作负载来说,计算的并行度并不是掣肘的因素,因此IBM在Power 7中会用"牺牲其他4核"的方式集中所有资源给剩下的内核,以提高计算强度。另外,从目前日趋流行的虚拟化和云计算发展来看,减少处理器内核有助于降低虚拟化软件的收费;而云计算也是按需付费计算核心数量,这样在获得较高数据库性能的同时,降低了成本。
4、AME技术将可用内存拓展100%
AME技术全称是Active Memory Expansion ,是从POWER7开始支持的一项新的内存虚拟技术。它通过内存数据压缩的方法,在已有内存容量不变的基础上,为服务器开辟更多的LPAR,或是提升LPAR性能。"沃森"同时处理海量数据检索,对内存需求达到了无以复加的地步--这几乎是一个追求极限性能的计算项目--与人脑对抗。
据IBM透露,在SAP应用测试环境下,Active Memory Expansion可以将内存量提升50%,该技术将使得之前受到内存容量限制的同性能服务器多处理65%的交易处理或用户量。在Power 7系统上,AME技术可以让SAP等内存密集型应用程序将目前的内存多认出50%,而有效扩展推度可以达到100%。
那么除却性能外,商业计算领域的客户也很在意计算的可靠性、可用性和可服务性(RAS),而这一特性也是制约x86平台发展的重要因素--却是Power 7的强势所在。在POWER7中,IBM引入了许多新的RAS特性,包括Processor Instruction Retry、Alternate Processor Recovery、Partition Availability priority、Live Application Mobility和Live Partition Mobility等。这些特性的主要目的都在于消除系统计划内和计划外的宕机时间。比如,当你将一台服务器关闭以进行重配置、固件升级时,你需要在不对生产造成影响的前提下把这台服务器上的应用迁移到其他服务器上面去。
下表全面比较了POWER、SPARC、Integrity、Xeon在重要RAS特性上的差异:
▲
最后,技术升级情况也是商业用户选择平台的重要因素。IBM在POWER 7系列产品中投入了超过32亿美金做研发,确保了持续有力的技术升级。而相继的产品升级也在规划中--据透露,POWER 8将于2013年上市。另一方面,结合新产品的新软件解决方案也能及时跟上,包括新一代的AIX操作系统、新一代PowerVM与PowerHA功能等,都与新品上市紧密相关,这无疑给了用户坚定的可持续购买POWER系统的信心,也让POWER系统的竞争优势更加明显。
从"沃森"的胜利我们可以看到小型机在人工智能方面的潜力--通过优化和整合实现超强的计算能力,为人工智能所需要的分析能力奠定基础。同时,IBM Power 7系列全面的产品线布局,也让我们意识到,在小型机和x86服务器的应用领域界限日渐模糊的今天,除了x86服务器正在不断改进性能,试图向高端市场渗透,小型机也将通过其低端产品及其高RAS特性的优势,向x86市场横向拓展。