服务器 频道

安腾大戏开幕 双核9000粉墨登场

  双核安腾2处理器带来两倍性能提升

  显式并行指令计算(Explicitly Parallel Instruction Computing,EPIC)是出现于上个世纪90年代一种“年轻”的计算模式,一般认为其源自VLIW(超长指令集字)。IA-64架构是基于EPIC实现的指令集体系结构,安腾则是基于IA-64架构的产品实现。

  相对于RISC,EPIC可以更有效的利用处理器中的多个并行单元,其核心理念就是显示并行概念。在EPIC体系中,编译器首先在编译过程中实现静态指令调度,而不是在处理器运行时动态的调度指令。也就是说EPIC体系中,由编译器决定哪些指令可以并行——编译器有充裕的时间完成代码的排序和优化,使之具有更加的并行执行性。EPIC一方面可以简化处理器复杂的控制电路,另外一个方面却需要借助于大量的寄存器、多个并行执行单元、很宽的数据通道和相应的判定和推测机制来确保其指令级并行(Instruction-Level Parallelism,ILP)处理能力。

  双核安腾2 9000系列处理器采用了90nm制程,整合了17亿个晶体管,最高运行主频可达1.6GHz。它依然具有每时钟周期6发射的能力,远远高于其它RISC产品以及IA-32架构的产品。第一代安腾处理器管线深度为10级,安腾2处理器的管线深度进一步缩减到8级,最新的双核安腾2处理器的管线深度也同样。英特尔科技亚洲有限公司服务器平台部亚太区平台市场营销经理吴定严也确认了这一点,新双核安腾2处理器的核心相对于单核安腾2处理器并没有太大的改进。

  因此我们借用Madison核心的安腾2处理器的结构示意图来简单介绍一下最新的双核安腾2处理器的核心。在英特尔正式公布的资料中可以确定的是,单个Montecito核心包括6个整数单元、6个多媒体单元、2个载入单元和2个存储单元,3个分支单元,2个扩展精度浮点单元和1个单精度浮点单元,这些同Madison核心相比基本没有变化(第一代安腾处理器则只有2个整数单元、2个多媒体单元、3个分支单元)。

  Montecito核心整合了16KB一级指令缓存和16KB一级数据缓存,1MB二级指令缓存和256KB二级数据缓存,还有容量高达24MB的三级缓存。其中一级缓存和二级缓存的容量同Madison处理器均相同,只是最大三级缓存从9MB增加到了24MB。Madsion处理器的一级缓存线宽为64字节,4路关联结构,二级缓存线宽为128字节,8路关联结构,我们推测Montecito在这个方面改变的可能性不是很大。Madsion 6MB处理器的三级缓存线宽为128字节,24路关联,或许Montecito的相关参数会有所改变。

  Montecito核心不再对于X86指令提供硬件级别的支持,转而采用软件模拟的方式,也就是上图中“IA-32 decode and control”部分的电路将不复存在。英特尔转而采用IA32执行层(IA32 Execution Layer)提供对于X86指令的支持,这个改变对于高端服务器市场的用户并不会产生影响。

  双核安腾2处理器的前端总线频率为533MHz/400MHz,相对于之前的单核安腾2处理器增加了对于533MHz前端总线的支持。而最早英特尔曾经试图为双核安腾提供667MHz前端总线,但是在去年10月份明确表示暂不引入667MHz前端总线。当我们问及英特尔亚洲服务器平台部经理吴定严先生原因时,他笑称英特尔太想让用户享用双核安腾处理器了,所以来不及加入。双核安腾2处理器的前端总线可提供提供8.53 GB/s的数据带宽,并且被设计为可支持4个物理处理器。

  在发布会现场,英特尔的工程师在两个4P安腾2服务器进行了SYSBENCH-OLTP测试,该软件是一个开源的在线交易处理负载测试软件,其通过对于数据库发送复杂的SQL交易请求,通过在拥有300000条记录的数据库中进行9种负载非常重的查询。测试结果显示,上一代安腾2服务器每秒可以完成385个交易请求,而双核安腾2服务器每秒可以完成710个交易请求,性能提升了约80%!

  英特尔在发布会上公布了众多数据来说明新双核安腾2处理器在性能上相对于前一代产品以及市场上竞争对手的对比数据。测试数据显示,配置了64颗英特尔安腾2 9050处理器的HP Superdome服务器的整数性能是配置了72颗Sun UltraSPARC IV+处理器的1.95倍。配置了32颗英特尔安腾2 9050处理器的SGI服务器的浮点性能是配置了32颗P5处理器的IBM服务器的1.1倍。SPECJBB2005测试结果显示,SGI服务器(64P 英特尔安腾2 9050处理器)的性能是Sun服务器(72P Sun UltraSPARC IV+)的1.62倍。

  英特尔公布的测试数据显示,双核安腾2处理器在中端和入门级市场也具有非常明显的性能优势。比如8P日立服务器(安腾2 9050)的浮点性能是8P UltraSPARC IV+服务器的2.3倍。HP的应用了新双核安腾2 9000处理器的服务器的TPC-C性能是使用上一代单核安腾2处理器的服务器的2.14倍!

双核安腾2刷新了4个新的世界记录

  下面的数据来自英特尔网站上公布的一些测试数据,同时他们还提供了详细的测试平台的信息,阅读这些数据,读者可以更加客观的了解双核安腾2处理器的表现。

  基准平台:Intel Itanium 2 1.6GHz 9MB L3

  OLTP基准测试,主要测量在线事务处理中的数据性能OLTP (NT/SQL)

  • Intel SR870BN4 Server System (Tiger 4)

  • Dual-Core Intel Itanium 2 “Montecito” 1.6 GHz. processors, 24 MB L3 cache, 1 MB L2I, 256K L2D, 16 KB, L1I, and 16 KB L1D. C0’ stepping, 400 MHz FSB,

  • Memory: 64 GB (16 x 4 GB DDR/PC2100, 266 MHz),

  • SOEMT Enabled (BIOS default)

  • Intel Itanium 2 “Madison” 1.6 GHz processors, 9MB L3 cache per CPU. A1 Stepping, 400 MHz FSB,

  • Memory: 64 GB (16 x 4 GB DDR/PC2100, 266 MHz).

  LinPack基准测试,主要测试CPU浮点性能

  • Intel SR870BN4 Server System (Tiger 4)

  • CPU: 8 cores, 4 chips, 1chip/socket, 2 cores/chip “Montecito” C0’ stepping processors with 12 MB L3 cache/core at 1.60 GHz/400 MHz

  • SoEMT disabled (Hyper-Threading Technology disabled)

  • CPU: 4 cores, 4 chips, 1chip/socket, 1core/chip “Madison” processors with 9 MB L3 cache at 1.60 GHz/400 MHz

  • System/Software (both systems): OS—Linux version 2.6.9-22.EL.

  SPECJBB2005基准测试,主要测试Web服务器性能

  • Intel SR870BN4 Server System (Tiger 4)

  • CPU Info: 4 x Intel Itanium 2 processor “Madison” 1.6 GHz with 9 MB L3 cache

  • Chipset: E8870

  • Memory: 16 GB (8 x 2 GB DDR/PC2100, 200 MHz)

  • CPU Info: 4 x Intel Itanium 2 processor “Montecito” 1.6 GHz (C0’ stepping) with 24 MB L3 cache

  • SoEMT enabled

  • Chipset: E8870

  • Memory: 32 GB (16 x 2 GB DDR/PC2100, 200 MHz)

  SPECCPU2000 (SPECint_rate_base2000)基准测试,主要测试CPU整合或者浮点性能

  • Intel SR870BN4 Server System (Tiger 4)

  • CPU: 8 cores, 4 chips, 1chip/socket, 2 cores/chip Montecito C0’ stepping processors with 12 MB L3 cache/core at 1.60 GHz/400 MHz

  • SoEMT disabled (Hyper-Threading Technology disabled)

  • CPU: 4 cores, 4 chips, 1chip/socket, 1core/chip “Madison” processors with 9 MB L3 cache at 1.60 GHz/200 MHz

  • OS—RedHat EL4.0 Update-2 (2.6.9-22.1.EL on Montecito and 2.6.9-22.EL on Madison 9 MB)

  • Application: CPU2000 version 1.2, Compilers: Intel C++ / Fortran Compilers for Linux* version 9.1 Build 20060102.

  ERP基准测试

  • Intel SR870BN4 MP Server System (Tiger 4)

  • Madison A1 Stepping 1.6 GHz/9 MB: 4P, 32 GB (16x2 DDR 266 MHz REG DIMMs)

  • Montecito C0’ Stepping 1.6 GHz (12 MB cache per core): 4 sockets, 8 cores, 16 threads

  • Operating system: SuSE Linux Enterprise Server 9 for IA64,

  • Madison: Linux kernel 2.6.5-97-smp

  • Montecito: Linux kernel 2.6.5-139 (主要增加了用于支持多核和多线程侦测的Montecito补丁)

  • Oracle9i Enterprise Edition Release 9.2.0.4.0 64-bit

  数据来源:www.tpc.org

  IBM eServer p5 570 4P配置

  • Power5* 1.9 GHz, 4P (2 processors, 4 cores, 8 threads)

  • 128 GB memory

  • Oracle Database 10g Enterprise Edition

  • IBM AIX 5L V5.3

  • result of 203,439 tpmC

  • published on 10/17/05

  HP Integrity rx4640配置

  • 2 Intel Itanium 2 processors 1.6 GHz with 24 MB L3 cache (2 processors, 4 cores, 8 threads)

  • 128 GB memory

  • Oracle Database 10g Enterprise Edition

  • HP-UX 11.iv2* 64-bit base OS

  • results of 200,829 tpmC

  • published on 03/21/06

0
相关文章