服务器 频道

强CPU 20倍!正睿Tesla GPU计算系统评测

  【IT168 评测】作为一家国产服务器品牌厂商,正睿经过多年积累与沉淀,不断给用户带来既有创新特点,又经验实惠的产品解决方案。正睿Tesla GPU计算系统正是其中之一。日前,正睿评测室 (http://www.zrway.com/lab/)给IT168服务器频道发来了对正睿 I249788S-H-TC4的测试报告,希望借此能帮助读者朋友们更深入地了解到更多关于Tesla计算的产品和应用。

  首先,我们通过拆解的方式来看看正睿 I249788S-H-TC4的内外部结构以及组件如何。

  外部结构

  正睿I249788S-H-TC4高性能Tesla GPU计算系统采用塔式结构设计,具备充分的可扩展性。从正面拍摄图可以看出,它具备8个热插拔盘位,2个前置USB接口,网卡、电源、硬盘LED指示灯。

外部结构

  在前面板有钥匙孔和防尘罩。前者可以保障数据安全,防止在未经得管理员同意的情况下被人恶意拆取硬盘,盗取数据。后者可以在保证散热良好的前提下,有效的减少灰尘进入机箱内部。

  正睿I249788S-H-TC4的背部有6个USB后置接口,1个VGA显示接口,1个COM口和P/S2键鼠接口,6声道音频输入输出接口,1个远程管理口。两个千兆网络接口,满足文件服务器、网格计算等对网络带宽的要求较高的应用需求。

外部结构

  它还配备2个可热插拔的抽风扇,将机箱内部的热空气抽出机箱,达到更好的散热效果。

外部结构

  内部结构

  正睿 I249788S-H-TC4服务器打开后,给人赏心悦目的感觉。即使是内部部件非常的多,结构布局看起来仍然非常清爽,各个部件的位置和走线井井有条,对于散热和后期维护都很有帮助。

内部结构

  它标配两颗英特尔32纳米制程工艺的至强E5620处理器,系统达成总计8核心,16条计算线程。每颗处理器拥有5.86GT/s QPI总线带宽、12MB超大智能缓存容量、支持睿频(智能加速)、虚拟化技术、TXT安全技术和AES-NI加密技术。

内部结构

  正睿 I249788S-H-TC4服务器的硬盘热插拔模块,为机箱前置的硬盘热插拔提供供电和数据传输支持。

内部结构

  在服务器内部,由4个9cm的热插拔风扇组成风墙为服务器内部各个部件提供散热保障的同时也保持了较低的噪音。

内部结构

  正睿 I249788S-H-TC4服务器采用1400瓦的1+1冗余电源设计。它也支持热插拔功能,在电源故障的情况下,只需要抽取损坏的故障电源模块,将新电源更换到到原有位置即可,整个更换过程不会导致服务器因此而停机。

内部结构

  正睿 I249788S-H-TC4 服务器标配4块Nvidia Tesla C1060 GPU计算模块,它以大型并行计算的多核心处理器为基础,搭配标准的CUDA C编程环境,简化多重核心的编程作业,能够满足高效能运算业界的效能需求,胜任运算要求最苛刻并且不断持续攀升的产业应用需求,包括药物研究、油气与天然气勘探、以及运算型的金融应用等。

内部结构

  接下来,我们看看这款正睿 I249788S-H-TC4服务器的性能评测部分。

  配置平台

  测试平台配置如下表所示:

配置平台

  硬件配置信息如下图:

配置平台
▲测试用的CPU信息

配置平台
▲使用的GPU信息

配置平台
▲CUDA-Z识别图

  此版本可以显示GPU核心运算能力和性能、显存容量和带宽。它显示了所有CUDA技术的单精度浮点和整数运算性能。同时它也显示了支持双精度操作的Tesla C1060计算模块的最新特性。该软件还可以生成一个HTML格式和TXT纯文本文件报告,方便用户参考。

  打开CUDA-Z软件后,可以很清楚地看到上面的4个选项卡,分别是Core(核心)、Memory(内存,这里指本地显存)、Performance(性能)、About(相关信息)。通过这4个界面,我们可以很清楚地了解到自己的NVIDIA显卡在通用计算方面的性能,当然这些都是硬件配置和理论性能。

  性能测试

  GPCBenchmarkOCL_cn OpenCL通用计算基础测试v1.0

  首款国人开发的支持GPU的OpenCL通用计算测试程序OpenCL General Purpose Computing Benchmark (简称GPCBenchMarkOCL)是由国内几名高性能计算从业人员和爱好者合作编写的,目的是为了评估在不同的OpenCL平台上一些基本算法和应用的性能。

  与目前流行的一些OpenCL、DirectCompute通用计算测试程序的不同在于,目前这些测试程序测试项目过于单一,基本上就是某一两种算法的性能测试,甚至干脆就是理论峰值计算性能的测试。

  而实际上,OpenCL计算设备包括GPU的计算性能是受非常多因素影响的,除了计算单元的频率和数量之外,还有计算单元架构、Global memory(显存)带宽、Local memory(GPU内的片上存储器,NVIDIA称为Shared memory,AMD称为Local Data Share)带宽和Bank conflict、存储器合并访问情况、存储器同步成本、缓存等各种因素。

  因此某些纸面计算性能非常高的GPU执行某些计算时性能却不一定好;又或者,某GPU在执行某种计算时虽然性能落后于另一架构的GPU,但是在执行另一种计算时性能反而超前。GPCBenchMarkOCL集合了高性能计算领域多种常见的基础算法和应用,能比较全面地评估GPU及其它OpenCL计算设备在通用计算应用中的性能。

OpenCL通用计算性能测试

OpenCL通用计算性能测试

OpenCL通用计算性能测试

  APDFPR 5.00 professional edition文件密码破译测试

  Advanced PDF Password Recovery (APDFPR)是用来解密受保护的 Adobe Acrobat PDF 文件的程序,它们设置了“用户”和/或“属主”口令,防止文件被打开或编辑、打印、选择文本和图形等等。

PDF文档密码破译测试
▲GPU系统的平均速度是每秒处理3.4亿次密码解密

PDF文档密码破译测试
▲CPU系统的平均速度是每秒处理1600多万次密码解密

  企业版(Enterprise Edition):包括一个新的“rainbow攻击”子系统 -- 它是用包含特殊 "Thunder tables" (tm) 的DVD 承载的,允许在几分钟而不是几天内解密所有的 40 位 PDF 文件。5.0版本支持 Adobe Acrobat 9 创建的 PDF 文件(256 位 AES 加密),支持多核心和多处理器,并且能使用 NVIDIA 显卡的硬件加速。

PDF文档密码破译测试

PDF文档密码破译测试

  总结

  从拆解评测中可以看到,正睿 I249788S-H-TC4 Tesla高性能计算系统在电源、硬盘、散热器等部件全采用热插拔设计,使计算机管理员在数据维护时,更加简便。它做工扎实、内部结构布局合理,令人赏心悦目的同时,稳定性也更有保障,并且它采用了80puls金牌认证电源,更加节能。

  从性能评测的结果数据可以一目了然地看到,正睿 I249788S-H-TC4 Tesla高性能计算系统较常规的x86架构计算机在某些应用计算对比测试中有绝对的性能优势。比如在APDFPR 5.00 professional edition软件的密码破译应用测试中,其性能达到AMD Phenom II X4 945的20倍之多,原来需要24小时才能完成的工作,在现在仅需1小时左右即可完成,大幅提高了工作效率。

总结

  在以后的通用计算测试中,我们准备逐渐开始测试一些经典的通用计算项目,如基于GROMACS分子动力学引擎的Folding@home项目等,这些项目能够检测到GPU在复杂运算环境下实际能力。

0
相关文章