服务器 频道

四路Tulsa首测 浪潮NF520D服务器

  特性

  • 全面的RAS特性
  • 良好的扩展性,可扩充至64GB内存,3TB磁盘
  • 智能化部署、管理和维护
  • 高级光路诊断系统

  价格

  • 112000元:Xeon 7110 x 1,2GB DDR2,73GB x 2,1+1冗余电源
  • 118000元:Xeon 7120 x 1,2GB DDR2,73GB x 2,1+1冗余电源
  • 156000元:Xeon 7130 x 1,2GB DDR2,73GB x 2,1+1冗余电源
  • 即日起至2007年1月20日期间,以全国统一价购买NF520D,可获赠同主频双核英特尔至强MP处理器一颗
  • 查询浪潮服务器报价

  【IT168评测中心】自从1999年年底第一颗Pentium 4处理器问世至今,NetBurst微架构先后被用于台式机、服务器和笔记本所使用的处理器中。从Intel现有的规划来看,NetBurst微架构还至少能服役到明年第三季度,届时基于Core微架构的Tigerton核心将会登场。

  本文的开始,我们先来回顾一下Xeon MP的发展历程。

  • 2002年3月,首款基于Inte NetBurst微架构的Xeon MP处理器问世,代号为Foster MP,主频在1.4GHz-1.5GHz之间,0.18微米制程,400MHz FSB,带有256KB L2缓存和512KB-1MB L3缓存。

  • 2002年11月,代号为Gallatin的Xeon MP发布,主频在1.5GHz-2.0GHz之间,采用了0.13微米制程,400MHz FSB,Socket603接口,带有512KB L2缓存,1-2MB L3缓存。在随后的2年中,Intel多次发布更高主频的Gallatin处理器。

  • 2004年3月,Intel推出了主频高达3.0GHz的Gallatin Xeon MP,并且带有4MB L3缓存,包含有1亿2千3百万个晶体管。

  • 2005年3月29日,Intel正式将其平台化策略应用于多路处理器产品中,发布了首款服务器专用平台产品Truland。该平台包括了TwinCastle芯片组(E8500)和代号分别为Potomac、Cranford的Xeon MP处理器。

    Potomac是高端Xeon MP版本,主频为2.83GHz、3.0GHz、3.33GHz,90纳米制程,667MHz FSB,带有1MB L2缓存和4-8MB L3缓存,可用于4路或者8路服务器系统。

    Cranford则是低端Xeon MP版本,主频为3.16GHz、3.66GHz,667MHz FSB,1MB L2缓存,彻底去掉了L3缓存。这两个核心的Xeon MP处理器均支持EM64T技术、EIST技术和超线程技术。

  • 2005年11月1日,Intel发布首款双核心Xeon MP处理器,代号Paxville,型号有7020(2.66GHz,2x1MB L2,667MHz FSB)、7030(2.8GHz 2x1MB L2,800MHz FSB)、7040(3GHz 2x2MB L2,667MHz FSB)和7041(3GHz 2x2MB L2,800MHz FSB)四款,90纳米制程,均没有L3缓存,开始采用604-pin FC-mPGA4封装。

  • 2006年,8月30日。Intel发布了代号为Tulsa的Xeon MP处理器。

Xeon 7130处理器外观

型号 制程 缓存 主频 前端总线 TDP SMP 双核心 超线程
7150N 65 nm 16 MB L3

2x1 MB L2
3.50 GHz 667 MHz 150W MP 支持 支持
7140M 65 nm 16 MB L3

2x1 MB L2
3.40 GHz 800 MHz 150W MP 支持 支持
7140N 65 nm 16 MB L3

2x1 MB L2
3.33 GHz 667 MHz 150W MP 支持 支持
7130M 65 nm 8 MB L3

2x1 MB L2
3.20 GHz 800 MHz 150W MP 支持 支持
7130N 65 nm 8 MB L3

2x1 MB L2
3.10 GHz 667 MHz 150W MP 支持 支持
7120M 65 nm 4 MB L3

2x1 MB L2
3 GHz 800 MHz 95W MP 支持 支持
7120N 65 nm 4 MB L3

2x1 MB L2
3 GHz 667 MHz 95W MP 支持 支持
7110M 65 nm 4 MB L3

2x1 MB L2
2.60 GHz 800 MHz 95W MP 支持 支持
7110N 65 nm 4 MB L3

2x1 MB L2
2.50 GHz 667 MHz 95W MP 支持 支持
7041 90 nm 2x2 MB 3 GHz 800 MHz N/A MP 支持 支持
7040 90 nm 2x2 MB 3 GHz 667 MHz N/A MP 支持 支持
7030 90 nm 2x1 MB 2.8 GHz 800 MHz N/A MP 支持 支持
7020 90 nm 2x1 MB 2.66 GHz 667 MHz N/A MP 支持 支持

  采用Paville核心的Xeon MP处理器属于Xeon 7000系列,而采用Tulsa核心的Xeon MP处理器属于Xeon 7100系列。Xeon 7100系列处理器主频范围在2.5GHz到3.5GHz之间,前端总线分为667MHz和800MHz两种,型号后缀为N的前端总线为667MHz,型号后缀为M的前端总线为800MHz。Xeon 7000利用处理器主频和前端总线频率来区隔不同型号的产品(Xeon 5000/5100系列处理器也是如此),而Xeon 7100则不仅利用主频、前端总线还利用L3缓存来区隔不同型号的产品。

  从我们所掌握的资料来看,Tulsa和Paville在处理器微架构上并没有明显的区别。因此Tulsa处理器如果要具有比Paxville更吸引人的性能,除了提升频率之外,就是在缓存上做文章了。

  每个Xeon 7100处理器均包含两个完整的核心,每核心均配置了1MB L2缓存,这仅是Xeon 7030/7040处理器L2缓存容量的一半。不过,Xeon 7100的两个核心可以共享“新增”的L3缓存,比如7110和7120均配置了4MB L3缓存,7130配置了8MB L3缓存,而7140和7150都配置了16MB L3缓存,因此缩减了L2缓存容量并不一定会牺牲处理器整体性能。特别需要说明的是,7140和7150的L3缓存容量达到了16MB,仅次于Intel于今年发布的双核Itanium 2 9000处理器24MB L3缓存的容量。但是增加L3缓存并非创新,从Xeon MP的历史来看,这样的“改变”仅仅是一次回归而已。

  65纳米制程的应用使得Tulsa处理器得以集成更大容量的缓存。不过即便如此,Tulsa核心面积依然达到了424平方毫米,而之前的单核Potomac核心面积为354平方毫米,Paville的核心面积也只有299平方毫米。如果处理器复杂程度变化不大,从90纳米制程升级到65纳米制程则意味着同样尺寸的晶圆可以切出更多的芯片,从而大幅度降低成本,但是Tulsa集成度远远高于前两代产品,因此其成本不会因此有明显降低。

  同样,因为集成度的提高(Xeon 7100处理器内包含13亿个晶体管),Tulsa的功耗的绝对值也维持着较高的水平。Xeon 7110/7120的TDP为95W,而7130、7140和7150则均达到了150W。考虑到Xeon 7100系列处理器主频更高,而且整合了L3缓存,其相对于Paxville处理器在能耗控制上还是取得了很大的进步的。

  Intel提供的资料显示,采用Tulsa核心的Xeon 7100系列处理器在ERP、SCM、CRM等商业应用中性能有60%以上的提升,更可以将交易处理速度提升70%以上(TPC-C测试,Tulsa 320000 TPM,Paxville 188000 TPM,Potomac 115000TPM),部分电子商务应用软件中其性能提升1倍以上。同时,Intel还宣称Xeon 7100系列处理器的每瓦特性能是上一代产品的2.8倍。

  大容量L3缓存除了可为处理器提供速度数据缓存之外,还可供Tulsa处理器内部的两个核心交换L2缓存数据之用,而无需经过FSB和北桥,这将大大提升缓存命中率,改善延迟效能。

  Tulsa处理器还首次引入了代号为“Pellston”的技术(之前仅在Itanium系列处理器中有应用),其正式名称为英特尔缓存安全技术(Intel Cache Safe Technology,ICST)。这个功能允许处理器和服务器在L3缓存出现少量错误的时候继续运行,它能自动的侦测并且屏蔽有问题的缓存管线,从而提升处理器的可靠性,降低宕机时间。

  Intel Xeon DP双核处理器经历了Paxville DP、Dempsey、Woodcrest的过渡阶段,Xeon MP双核处理器看来也会经历同样的过程,先是Paxville、现在是Tulsa、明年将会是Tigerton。Dempsey是最后一个采用NetBurst微架构的Xeon DP处理器核心,而Tulsa也将是最后一个采用NetBurst微架构的Xeon MP处理器核心。

  E8501芯片组,Tulsa运行平台

  在发布Potomac Xeon MP处理器的同时,Intel首次把平台概念引入其多路处理器产品的市场之中——Truland平台应运而生。随着,Paxville/Tulsa处理器的发布,Truland平台中的TwinCastle芯片组无法完全的支持该产品的所有特性,因此Intel同时将Truland平台进行了小小的升级,E8500芯片组升级到了E8501,从其型号的变化来推测E8501芯片组的变化应该不大。

  完整的E8501芯片组包括4个部分:E8501北桥芯片、XMB扩展内存桥接芯片、ICH5 I/O控制器整合芯片、PXH PCI整合芯片。如上图所示,其中的E8501北桥芯片是整个E8501芯片组架构的中心,它提供了两条667MHz或者800MHz FSB,每条FSB可支持两个64bit Intel Xeon MP(Potomac或者Cranford)或者双核Intel Xeon 7000/7100处理器(Paxville或者Tulsa);它还提供了4个独立内存接口(IMI,Independent Memory Interfaces)用于连接XMB芯片;北桥芯片通过HI 1.5总线(66MHz,8bit,4x,266MB/s)同ICH5芯片通信;北桥芯片可以通过4条PCI-E链路(x4、x8、x8、x8)同其它高吞吐量设备连接,比如PXH芯片。

  E8501芯片组提供了两条667MHz或者800MHz FSB,每条FSB可提供5.3GB/s或者6.4GB/s带宽,而且要支持两个处理器,即便是单核处理器,FSB的带宽也显得有些“窄”,而现在每条FSB总线要负担4个处理器核心的数据传输,理论上讲该平台是存在明显的瓶颈的。而实际上,可能可以借助大缓存、乱序执行、总线一致性等功能来提升其效率,缓解带宽压力。

  E8501北桥芯片提供了4个IMI接口(点对点、差分、可恢复时钟内部互联),每个接口具有5.33GB/s的读取带宽和2.67GB/s的写入带宽,并提供了40-bit(约1TB,240 bytes,EM64T技术)内存寻址能力,具备内存技术独立功能,每个IMI均支持热插入。

  XMB芯片才是真正的内存控制器,它支持16-entry读取请求队列和16-entry写入请求队列,支持Write/Write、Write/Read、Read/Read顺序保留功能。E8501所采用的XMB芯片并无改进,每个XMB支持双通道DDR2-400内存,可支持256/512/1024Mbits内存芯片(x4和x8),可支持512MB-32GB内存,因此4个XMB最大可支持128GB内存。

  E8501北桥芯片提供28 lane PCI-E总线,可以配置为3个x8和1个x4链路,每个x8链路也可以配置为2个x4链路,每个x4链路单方向带宽为1GB/s,x8链路单方向带宽可达2GB/s。

  总得来说,E8501芯片组并没有明显的改变,比如其XMB芯片、ICH5、PXH芯片都没有变化,仅仅是E8501有了一些变化,比如增加了对于800MHz FSB的支持。

  四路双核,浪潮英信NF520D概述

  浪潮英信NF520D四路服务器基于最新的Intel Truland平台设计,可以支持包括Xeon 7000和Xeon 7100在内的全系列双核Xeon MP处理器,可用于金融、交通、邮政、电信、能源等行业关键商务应用。

  浪潮英信NF520D服务器外形尺寸为261.6mm(高) x 698.5mm(深) x 444.5mm(宽),既可做6U高度的机架式服务器,也可做塔式服务器使用。

  这款服务器最高可安装10个3.5英吋热插拔硬盘,并且预装了超薄型DVD-ROM驱动器,此外还提供了两个5.25英吋扩展槽位,可用于扩展磁带机等设备。

  主要的按钮、指示灯和接口都位于浪潮英信NF520D服务器前面板的左上角,它们包括:服务器电源开关按钮、复位按钮、ID指示灯按钮、硬盘活动指示灯、两个网卡指示灯、系统状态指示灯、系统ID指示灯、前置VGA接口和3个前置USB接口。

  浪潮英信NF520D服务器标配了了1+1冗余电源,每个电源的最大输出功率达到了1750瓦,可充分满足服务器各个部件的供电需求。每个电源均设计有3个状态指示灯,便于系统管理员查看电源的状态。每个电源接口附近还设计了简易但有效的防电源线脱落的装置。

  服务器后面板提供了1个串口、1个VGA接口、2个千兆网口(RJ45)、2个USB接口、系统ID指示灯按钮、管理模块端口(RJ45)、直流电接口。此外,我们还能了解到这款服务器可以安装7个PCI类扩展设备。

  浪潮英信NF520D服务器内部设计

  通过介绍浪潮英信NF520D服务器内部的布局和设计,读者可以对于这款服务器系统的稳定性、可靠性以及冗余特性有进一步的了解。如上图所示,该服务器系统的前部设计有3组6个系统风扇,每组风扇可互为冗余,支持热插拔,并且同机箱侦测联动——当机箱盖处于开启状态,风扇会自动全速运转,以确保在系统风道不正常的同时,为系统部件提供足够的散热。

  系统风扇产生的气流在导风罩的引导下,首先流经处理器散热片,然后再为PCI类扩展卡、内存模组以及其它系统组件提供散热。

  浪潮英信NF520D服务器标配一颗Xeon 7110或者Xeon 7120或者Xeon 7130处理器,我们收到的测试机为配置了4颗Xeon 7130M处理器的配置。Xeon 7130M处理器主频为3.20GHz,Socket 604封装,65nm制程,步进版本B0,支持MMX、SSE、SSE2、SSE3、EM64T等技术。处理器支持EIST技术,其倍频可在14x-17x之间变动,FSB频率为800MHz。每个处理器核心配置了16KB L1数据缓存、12kuops L1追踪缓存、1MB L2缓存,并且共享8MB L3缓存。

  相对于我们常见的双路机架式服务器,浪潮英信NF520D四路服务器最特别的地方是其内存子系统的设计,当然这种特别之处也是由于E8501芯片组的功能和特点来决定的。如上图所示,服务器主板安装了4个XMB扩展板,每个XMB扩展可支持4个DDR2内存模组,这款服务器最高可支持64GB内存,可充分满足高内存容量应用的需求。

  这款服务器的内存子系统支持内存热插拔、内存镜像、内存热备、内存RAID等高级内存容错功能;支持4路交叉存取功能,可提供高于普通模式下的内存带宽;支持X4 SDDC、X8 SDDC功能,可纠正任意的单Bit错误、检测任意的双Bit错误,在使用指定的内存时,最多可纠正4Bit或者8Bit错误;支持完整的Memory Scrubbing功能,可利用空闲状态提前查找、纠正内存单Bit错误;对于无法纠正的错误,能够自动重新尝试从其它数据保存点获取正确的数据。

  浪潮英信NF520D服务器板载了LSI LOGIC LSI53C1030智能双通道Ultra320 SCSI控制器芯片,该芯片整合了ARM处理器,采用PCI-X总线同芯片组通讯,同时通过主板扩展了容量高达512MB的缓存,因此这种板载RAID控制器也能提供较高的性能,在后面的测试大家将会看到这一点。

  浪潮英信NF520D服务器提供了1个热插拔x8 PCI-E插槽、3个热插拔x4 PCI-E插槽、1个热插拔64bit/133MHz PCI-X插槽和2个64 bit/100MHz PCI-X插槽。(如上图所示,绿色标识说明该插槽支持热插拔功能,而蓝色标识则说明不支持)

  Broadcom BCM5704是可用于LOM(LAN on Motherboard)和NIC(Network Interface Card)应用的单芯片Dual 10/100/1000 MAC+PHY解决方案,它支持VLAN标记、二层优先编码、链路聚合、全双工流控等功能,并且可通过PCI和PCI-X总线接口同系统通讯。

  浪潮英信NF520D服务器系统管理

  浪潮英信NF520D服务器提供了高级光路诊断技术和智能管理系统可协助系统管理员快速了解系统健康状况,并能及时判断硬件错误位置,借助于智能管理系统监控服务器系统的管理事件并且把它们记录到指定的存储器中。

  高级光路诊断技术目前已经被很多主流的服务器厂商所应用,浪潮英信NF520D服务器也利用这种技术来提升产品的可管理性,降低排查硬件故障的难度,缩短设备维护时间。系统管理员可以通过前面板的指示灯大致了解系统目前是否有故障发生,如果有的话则可以打开机箱盖来观察,在系统风扇、XMB扩展模组、磁盘控制器、VRM模块、系统电源上都设计有指示灯,利用这些指示灯所提供的信息,系统管理员可以快速的缩小故障范围。

  这款服务器还配置了浪潮高级服务器管理模块,该模块支持IPMI1.5、IPMI2.0、WfM2.0、EMP等协议,可提供远程管理和远程诊断功能,结合浪潮睿捷管理套件,可以更加方便的进行系统管理和维护。

  浪潮睿捷管理套件包括蓝海豚系统智能安装软件和猎鹰管理软件。蓝海豚系统智能软件可以帮助用户安装主流的操作系统(比如 Windows 2003 Server和Red hat Enterprise Linux),它不但明显降低了部署操作系统部的难度,而且可以提高大规模部署服务器操作系统的效率。这次测试所试用的蓝海豚系统智能安装相对于去年的蓝海豚导航软件最明显的改进是彻底放弃了软驱。

  蓝海豚系统智能软件可以引导没有安装操作系统的服务器进入到Linux图形界面。用户在这个界面可以制作驱动程序软盘,查看光盘可提供的常用软件和系统补丁,浏览详细的系统主要部件的信息,阅读机型介绍等等。

  浪潮猎鹰服务器管理软件是浪潮服务器软件研发项目专为浪潮服务器产品开发的一款专业的管理软件,目前的最新版本是V3.2。它可对Windows和Linux服务器节点状态进行实时监控和资源管理,为系统管理员提供了一个统一的、集中的、可视化的和跨平台的管理工具。

  浪潮猎鹰服务器管理软件由三个组成部分:主控制台、事件接收器、代理监测。安装了主控制台和事件接收器的管理控制台可以对于受控Windows和Linux平台进行统一管理,负责整个网络系统配置、管理和监控。受控端的各种信息由代理监测采集并且传送给事件接受器,而管理控制台发送的指令也是由前两者来传递信息的。这套软件兼容WMI、IPMI、SNMP等规范,可以同第三方的网管软件结合使用。

  利用猎鹰软件,管理员可以对于被管理服务器进行分组管理,可以以组为单位执行注销、重新启动、关机和网络唤醒都等操作。为了避免多台服务器同时关闭或者开启时对于供电电路的冲击,用户还可以设定两个操作之间的延时。

  猎鹰软件还可以查看某一台服务器的具体参数,比如CPU、内存、磁盘、网络适配器以及SCSI等硬件设备的状态;操作系统的主要的参数以及安装的软件的状态;磁盘占用率、CPU以及内存占用率和网络性能;对于每台服务器所运行的进程、服务以及日志和端口进行管理。

  这款软件还提供了多种报警方式,它可以播放用户指定的WAV文件或者直接启动蜂鸣器;弹出对话框、跳出气球提示,同时还会把这一切记录在日志上。如果实现设定好了SMTP服务器以及拨号设定,它还可以通过电子邮件或者拨打电话来发出警告。

  猎鹰软件可以分别记录管理员日志、告警日志、ASF事件日志,用户可以按照组、服务器名称以及日志类型快速的检索,同时还提供了日志备份功能。

  测试平台和测试方法

浪潮英信NF520D服务器配置

主板

Intel SE8500HW4

芯片组

Intel E8501

驱动程序

INF 8.1.1.1001

处理器

Intel Xeon 7130 x 4(Tulsa)

主频

3.20GHz

FSB

800MHz

L2容量

1MB x 2
L3容量 8MB(共享)

处理器设置

XDbit Disable
EIST Disable
C1 State Disable

内存

 

SPD 3-3-3-
总容量 1GB x 4 x 4

磁盘控制器

LSI LOGIC LSI5030 RAID板载控制器,512MB缓存

硬盘

FUJISU MAU3073NC

驱动程序

1.18.0.32

磁盘设置

3块硬盘组建为RAID 5模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行

操作系统

Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1)

网卡

Broadcom BCM5704 NetXtreme Gigabit Ethernet

驱动程序

2.6.14.0

  我们在上述配置的服务器上分别安装了Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1),正确安装了各个硬件的驱动程序,确保服务器工作在非常好的的状态。

  我们所使用的评测项目如下:

  • SPECCPU2000 v1.2

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU2000是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2000和CFP2000两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2000的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler这两款SPEC CPU2000必需的编译器,另外安装了Microsoft Visual Studio 2003.net提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,可以满足Base测试。然后我们根据被测系统实际可同时处理的线程数量,设定用户数量,分别运行SPEC base和SPEC rate base测试的结果(其中SPEC base代表系统执行某个任务的速度,而SPEC base rate测试代表系统可以同时处理任务的能力)。

  • ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  • IOMeter 2004.7.30

  IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  • SiSoftware.Sandra.SP1 v2007

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。今年该软件推出了2007版,该版本新增了4项基准测试,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD这四个项目。另外,它还对于原有的几个基准测试模块进行升级,比如在Arithmetic benchmarks中增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • WebBench v5.0

  WebBench是针对服务器作为Web Server时的性能进行测试,我们在被测服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们开启了网络实验室中的56台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。

  静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。我们使用了实验室中的56台客户端,配合Static_mt.tst多线程静态脚本测试向被测服务器发送请求。

  动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。我们将一个C语言编写的CGI源文件Simcigi.c编译为Simcgi.exe,并将其作为动态测试中的CGI脚本。在测试过程中,每台安装了WebBench客户端软件的PC,会在300秒的时间内持续向服务器发送CGI请求,而控制台会纪录并汇总服务器所响应CGI请求的数据。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。

  • NetBench v7.03

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。

  • Benchmarkfactory 4.6

  大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2000 SP4来测试不同的硬件平台在数据库应用中的表现。

  我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。

  • 系统功耗监测

  我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。

对比平台1:Woodcrest DP 3.0服务器配置

主板

Dell PowerEdge 2950

芯片组

Intel 5000X

驱动程序

INF 8.1.1.1001

处理器

Intel Xeon 5160 x2(Woodcrest)

主频

3.00GHz

FSB

1333MHz

L2容量

4MB(共享)

处理器设置

XDbit Disable
EIST Disable
C1 State Disable

内存

Hyundai HYMP512F72BP8N2-Y5

SPD 333MHz 5-5-5-15
总容量 1GB x 4
配置 4通道 Interleave

磁盘控制器

DELL PERC 5/i Integrated RAID Controller

硬盘

MAXTOR ATLAS 10K V(300GB SAS)

驱动程序

1.18.0.32

磁盘设置

3块硬盘组建为RAID 5模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区上进行

操作系统

Microsoft Windows 2003 Enterprise Server R2 5.02.3790 (Service Pack 1)

网卡

Broadcom BCM5708C NetXtreme II GigE

驱动程序

2.6.14.0

 

对比平台2:Dempsey DP 3.0服务器配置

主板

Lenovo DPX1066

芯片组

Intel 5000V+ESB2

驱动程序

INF 7.3.1.1013

处理器

Intel Xeon 5050

主频

3.0GHz

FSB

667MHz DIB

L2容量

2 x 2MB

处理器设置

XDbit Disable
EIST Disable
C1 State Disable
HyperThreading Enable

内存

英飞凌HYS72T64000
512MB 1Rx8 PC4200-4200F

内存时序

444-10

磁盘控制器

LSI MegaRAID 320-0 零通道RAID卡

硬盘

FUJITSU MAT3073NC x 3

驱动程序

6.43.2.32(3/16/2004)

磁盘设置

三块硬盘配置为RAID 5模式,磁盘分为两个分区,均为NTFS格式,系统默认簇,主分区20GB,其它分为扩展分区,共享文件夹、磁盘测试均在格式化后的扩展分区进行

操作系统

Microsoft Windows Server2003,5.02.3790,SP1

网卡

Intel Pro/1000EB Network Connection with I/O Acceleration

驱动程序

9.3.28.0(1/23/2006)

  处理器性能测试

  整数性能测试中包括11个C程序和1个C++程序(252.eon),它们分别代表数据压缩(164、256)、电路布线(175)、C编译器(176)、 最低成本网络流解算机(181)、象棋模拟程序(186)、自然语言处理(197)、光线追踪(252)、Perl应用(253)、计算机群论(254)、面向对象的数据库应用(255)等应用。

  浮点性能测试中包含了14个程序,分别代表量子色动力学(168)、浅水模型(171)、3D势场多栅格解算器(172)、抛物/椭圆偏微分方程(173)、3D图形库(177)、流体动力学(178)、神经元网络(179)、有限元模拟:地震模型(183)、面部识别(187)、计算化学(188)、数论(189)、有限元模拟:碰撞(191)、粒子加速器(200)、污染物扩散(301)。

SPECint
rate_base2000
对比平台 NF520D Dempsey DP 3.0 Woodcrest DP 3.0
开启线程数量 16 8 4
164.gzip 126 60.1 83.1
175.vpr 95.2 39.5 83.8
176.gcc 182 83.7 131.0
181.mcf 93.4 25.5 60.8
186.crafty 110 53.1 90.3
197.parser 149 65.7 99.6
252.eon 187 87.7 138.0
253.perlbmk 151 71.2 137.0
254.gap 126 61.6 104.0
255.vortex 223 104 175.0
256.bzip2 134 48.4 80.5
300.twolf 141 54.3 143.0
总分 138 59.2 106.0

 

SPECfp
rate_base2000
对比平台 NF520D Dempsey DP 3.0 Woodcrest DP 3.0
开启线程数量 16 8 4
168.wupwise 92.3 61.8 101.0
171.swim 53.3 30.7 54.2
172.mgrid 49.8 27.7 49.4
173.applu 45.0 29.3 51.2
177.mesa 90.3 59.3 127.0
178.galgel 153.0 61.8 230.0
179.art 82.5 40.1 159.0
183.equake 47.3 25.7 48.9
187.facerec 95.8 46.4 95.5
188.ammp 100.0 32.6 83.5
189.lucas 53.1 30.5 51.1
191.fma3d 60.5 33.8 60.5
200.sixtrack 56.7 33.7 53.1
301.apsi 101.0 49.7 61.0

总分

72.2 38.4 76.9

  由于我们IT168评测中心目前对于四路服务器系统测试的并不多,因此没有能与之相当的对比平台,因此我们选择了两个主频与Xeon 7130M处理器相近的两个双路Xeon服务器平台的测试结果与之比较(Dempsey是Xeon DP系列产品中最后一个使用Netburst微架构的产品,它同Tulsa的微架构最接近,Woodcrest是第一个使用Core微架构的Xeon DP产品),通过这个比较,读者将会了解到四路服务器和两路服务器在不同应用中的性能特性。

  SPECint rate_base2000测试结果显示浪潮英信NF520D四路服务器具有明显的优势,在整数应用中其吞吐量是双路Dempsey系统的2倍以上,这也说明基于Netburst微架构的产品,在合适的运行平台上,具有较好线性扩展能力——比如,用户在初次购置浪潮NF520D的时候,可以仅配置两路处理器,等到应用需求增长更高时,只要再添加两个处理器即可获得一倍的性能。浪潮英信NF520D四路服务器同双路Woodcrest系统的性能差异只有20%左右,而且双路Woodcrest系统已经在300.twolf测试子项目中取得领先了。

  SPECfp rate_base2000测试结果显示浪潮英信NF520D四路服务器的浮点应用吞吐量接近于双路Dempsey系统的2倍,但是其浮点性能已经低于双路Woodcrest系统的性能了。

  可见新的Core微架构的确领先于Netburst微架构,它使得双路Xeon DP平台的性能有了大幅度的提升,这也大大增加了Xeon MP平台升级迫切性。

SiSoftware.Sandra.Enterprise.v2007 Sp1

对比平台 NF520D Dempsey DP 3.0 Woodcrest DP 3.0
Processor Arithmetic
Dhrystone ALU(MIPS) 62397 28717 55430
Whetstone iSSE3(MFLOPS) 78131 36410 37974
Processor Multi-Media
Integer x8 iSSE4(it/s) 187607* 87718 329360
Floating-Point x4(it/s) 240459 113162 178485

  Sisoftware Sandra 2007处理器测试包括算术运算性能测试和多媒体运行性能两个部分,在各个测试项目中,浪潮英信NF520D服务器的性能基本上都是双路Dempsey DP 3.0系统的两倍以上。同双路Woodcrest DP 3.0系统对比,我们可以发现除了Integer x8 iSSE4测试(这项的差异,主要是因为Xeon MP 7130M不支持SSE4多媒体指令集)之外,浪潮英信NF520D服务器都有明显的优势。

  缓存内存性能测试

SiSoftware.Sandra.Enterprise.SP1 v2007

Memory Bandwidth
RAM IntBuff iSSE2(MB/s) 5353
Assignment   5086
Scaling 5145
Addition 5595
Triad 5587
RAM FloatBuff iSSE2(MB/s) 5374
Assignment 5153
Scaling 5172
Addition 5590
Triad 5584

  Memory Bandwith测试结果显示浪潮英信NF520D服务器的内存带宽达到了5.4GB/s左右,不同平台的带宽同其所使用的内存频率有有关。我们对于Cache and Memory测试结果更加感兴趣,当测试数据块小于16KB时,使用Xeon 7130M处理器的NF520D服务器的带宽占据优势;当测试数据块在16KB-128KB之间时,Woodcrest系统占据了优势;当数据块在256KB-16MB之间时,Xeon 7130M处理器的带宽依然保持在一个很高的水平上,显然容量为8MB的L3缓存此时起到了巨大的作用。Dempsey处理器因为依然是Netburst微架构,而且也没有L3缓存的帮助,因此在这项测试中无法与前两者相比。

  SiSoftwaren Sandra 2007可以测试缓存内存子系统的随机访问延迟时间和线性访问延迟时间。浪潮英信NF520D服务器测试结果明显的受到其L3缓存的影响,当测试数据块小于16MB时,Xeon 7130M的延迟时间明显的比Dempsey短,当测试数据块等于大于16MB时候,也就是需要调用的数据超过L3缓存的容量时,两者之间的延迟时间并无明显的差异。

  Woodcrest处理器因其更先进的微架构,在这项测试中明显的优于另外两者,即便是Xeon 7130M配置了8MB L3缓存,也无法在小数据块应用中占得上风。

  磁盘性能测试

  浪潮英信NF520D服务器的磁盘子系统由LSI Logic 1030控制器芯片和3块FUJITSU MAU3073NC SCSI硬盘组成,我们将其组建为RAID 5磁盘阵列模式。

  从测试曲线来看,浪潮英信NF520D服务器的磁盘子系统的读取IO性能和写入IO性能都非常的出色,其中读取性能达到了69374 IOps,写入性能也达到了23298 IOps。该磁盘子系统的读取吞吐量也达到了较高的水平,为172 MB/s。写入吞吐量并不高,只有几十MB/s的水平。

  以下为2007年01月10日增补:

  由于浪潮英信NF520D服务器采用的是基于LSI Logic 1030控制器芯片设计的Intel ROMB(RAID On Motherboard)控制器,我们在其BIOS设置内并没有发现能够开启写缓存的选项。

  针对这种情况,浪潮的技术人员提供了给了我们Intel ROMB管理软件,利用这个软件可以在操作系统运行的环境下开启写缓存功能,从而提升了该服务器磁盘子系统的IO处理能力和吞吐量(特别是写入IO处理能力和写入吞吐量)。从上面的曲线图来看,该磁盘子系统的写入IO处理能力达到了同读取相同的性能水平,写入吞吐量也从十几个MB/s达到了88MB/s左右。,读取IO处理能力也从49000IOps提升到59000IOps,吞吐量没有提升。

  需要指出的是,这种磁盘控制器并没有独立的IO处理器(LSI Logic 1030虽然整合了ARM处理器,但是性能有限),要进一步提升磁盘子系统的性能或者通过安装ZCR扩展卡实现或者需要占用更多的系统的处理器资源。

  未开启写缓存 开启写缓存
读取CPU占用率 9.2% 30.3
写入CPU占用率 3.5% 31.5

  上面的表格是在读取IO能力和写入IO能力测试时的CPU最高占用率,可以发现在没有利用ROMB开启写缓存功能时,读取CPU占用率只有9.2%,而利用这个软件之后,读取的CPU占用率也提升到30%,读取IO处理能力只是提升了20%左右。写入IO处理能力提升了3倍,CPU占用率则提升了9倍。

  对于这款浪潮英信NF520D服务器的磁盘子系统的表现,我们建议厂商和用户这样来看待。不要过分计较测试结果如何,把这款产品提供给适用的客户(或者说选择适用于适用的产品)才是目的,毕竟不是所有的客户都需要很强的写入能力,而这款服务器的磁盘子系统采用了成本相对较低的板载集成的方式,已经提供了令人满意的读取能力,写入IO能力也处于中游水平,而且结合ROMB管理软件可以获得更丰富的功能,是一款不错的板载服务器磁盘控制器。

  文件服务器性能测试

  浪潮英信NF520D服务器采用了Broadcom BCM5704 Dual 10/100/1000 MAC+PHY单芯片解决方案,安装驱动程序之后在Windows系统中可以看到两个名称为“Broadcom BCM5704 NetXtreme Gigabit Ethernet”的千兆网卡,测试结果显示其吞吐量在890-901 Mbps之间。

  NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,这项测试不但要求被测磁盘子系统具有较高的吞吐量还需要具备较高的IO处理能力。测试结果显示,浪潮英信NF520D服务器的峰值吞吐量可达到772 Mbps,就基于板载磁盘控制器的磁盘子系统而言,这个测试结果相当的优秀。

  以下为2007年01月10日增补:

  利用Intel ROMB软件开启写缓存功能,会明显的提升被测服务器在文件服务器应用方面的表现,测试结果显示了浪潮英信NF520D服务器的文件服务器应用的峰值达到了1773Mbps,而且还有继续提升的趋势。如果用户需要把这款服务器用于负载繁重的文件服务器应用中,那么利用Intel ROMB管理软件开启写缓存功能是非常有必要的。

  Web服务器性能测试

 

  Web服务器测试分为静态应用测试和动态应用测试,IO能力对于静态应用的性能有明显的影响,而处理器计算能力、缓存内存效能则对于动态应用的性能有明显影响。静态测试曲线显示,浪潮英信NF520D服务器最高可处理15300个左右的静态请求。动态测试曲线显示,浪潮英信NF520D服务器峰值处理能力达到了每秒8063个动态请求,大幅度领先于双路Dempsey 3.0GHz平台。不过同双路Woodcrest 3.0GHz平台相比,却不占优势了。

  数据库服务器性能测试

 

 

  我们在被测服务器上安装了Microsoft SQL 2000 SP4,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟800个用户,并且以8个一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。在测试期间,数据的吞吐量很小,因此磁盘吞吐量和网络吞吐量都不会成为瓶颈。

  浪潮英信NF520D服务器的测试曲线非常的平滑,当用户数量超过64个以后,该服务器每秒可处理操作数量稳定在52000以上,峰值并不高仅达到了53416 TPS——即便是同时有1600个虚拟用户同时接入,也依然有52000 TPS的处理能力。双路Depsey 3.0GHz平台的处理能力明显低于四路Tulsa平台,其峰值仅有37000 TPS,平均值为35000 TPS左右。双路Woodcrest 3.0GHz平台的性能惊人,峰值达到了12800 TPS,平均值69000 TPS。

  服务器整体功耗

  我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:

  • P1:连接电源但不开机状态

  • P2:系统启动完毕,5分钟内无动作,但不休眠

  • P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作

  浪潮英信NF520D服务器主要硬件配置包括4颗Xeon 7130M处理器、16条1GB DDR2 400MHz内存、板载LSI LOGIC 1030控制器、3块FUJITSU MAU3073NC SCSI硬盘和6个机箱风扇。浪潮英信NF520D服务器配置了1+1冗余电源,其最大输出功率为1570瓦。

  在接通电源但是不启动的状态下,其功耗约为33瓦,而进入系统之后常时间无动作(不启用节电模式),系统功耗为535瓦,我们使得处理器满载同时让磁盘子系统工作在最大吞吐量模式下,此时系统功耗达到了785瓦。

  IT168评测中心观点

  面对AMD Opteron处理器在服务器市场不断攻城略地,基于Netburst微架构的Xeon DP/MP处理器显得力有不逮。Intel于今年6月份发布的Woodcrest核心的Xeon DP终于扭转了其在双路双核市场上的不利局面。在多路服务器市场上,Intel也加快了进度,提前一个季度发布了Tulsa处理器,利用大容量的L3缓存设计,在不更换处理器微架构的前提下,再次大幅度提升了Truland平台的性能。

  虽然合作厂商们也清楚Intel会在明年下半年发布基于Core微架构的全新Xeon MP处理器产品(预计届时整个Xeon MP平台也会随之更新),他们还是及时的将其产品升级,比如HP DL580、ML570、Dell PowerEdge 6850和本文的主角浪潮英信NF520D均采用了Xeon 7100系列处理器。其原因之一是升级到Tulsa处理器,无需对于原有平台进行升级。原因之二是新的Tulsa处理器的确可以明显的提升Xeon MP系统的性能,特别是集成了16MB L3缓存的版本。

  我们的测试显示,中等配置的浪潮英信NF520D服务器在部分应用中能够明显的领先于优异配置的双路双核服务器,但是在部分应用中已经出现了落后于双路服务器的现象。这个现象说明了两个方面的问题:就目前的产品而言,如果配置16MB L3缓存的Tulsa处理器,四路服务器可以提供更高的性能,而双路服务器的性能已经到顶;另外一个方面的问题,则是需要Intel来解决的——为了更好的区隔产品,将Xeon MP升级到Core微架构已经是迫在眉睫的事情了。

  浪潮英信NF520D服务器适用于大型网络的中间层或后台资源服务器,或者用于证券交易、期货买卖、实时计费等对计算性能与稳定性要求苛刻的商务应用,也可用于大型企业信息化建设中的ERP、CRM、竞争情报监测等重要应用。

  因此,RAS特性相对而言更加重要。Tulsa处理器同芯片组之间的前端总线支持奇偶校验和ECC功能,Tulsa处理器本身支持缓存安全技术;内存子系统支持内存热插拔、内存镜像、内存热备、内存RAID等高级内存容错功能,此外还能支持X4 SDDC、X8 SDDC和完整的Memory Scrubbing功能;利用带有ARM处理器的LSI Logic 1030磁盘控制器提供了RAID 0/1/5等兼顾性能和可靠性的磁盘子系统。从多个方面确保了系统在高速运转的过程中数据的可靠和准确。

  浪潮将NF520D服务器誉为“智能之星”,该产品无论是在部署过程中还是在管理和维护等方面均应用了智能化的理念。比如利用浪潮蓝海豚系统智能软件可以引导服务器进行无人职守的操作系统的安装,高级光路诊断技术则能帮助管理人员迅速的判断硬件的故障位置,浪潮猎鹰软件可以帮助系统管理员更高效的管理服务器。此外SCSI热插拔硬盘、热插拔XMB内存扩展,热插拔系统风扇和冗余设计、采用了1+1热插拔和冗余设计的电源都可大大提升服务器不间断运行的能力。

  为了适应快速成长的需要,浪潮英信NF520D服务器提供良好的扩展能力,比如它可通过4个热插拔内存板将内存容量扩充到64GB,最多可扩展10块SCSI硬盘,提供最大3TB的存储容量,此外还提供了总共7条PCI类扩展卡(PCI-E、PCI-X和PCI)。这种扩展能力是双路机架式服务器所无法提供的。

0
相关文章