服务器 频道

多核、新总线、虚拟化,2007服务器平台趋势

  【IDF2007】Bensley服务器平台的成功并没有让英特尔有放慢前进脚步的想法。

  IDF期间,英特尔宣布年内将会将其DP、MP服务器平台进行全面的升级,新的平台们保持对现有处理器兼容的前提下,还会对采用了45nm制程的四核处理器提供全面的支持。同时,还会在部分平台上引入PCIe 2.0、10GbE等新技术。

  定位主流DP市场的Stoakley平台

  英特尔去年发布了代号Bensley的DP平台,该平台采用了代号Blackford的芯片组(也就是Intel 5000系列芯片组),可支持Dempsey(Xeon 5000)、Woodcrest(Xeon 5100)和Clovertown(Xeon 5300)系列处理器,首次采用了FB-DIMM内存和Intel I/O加速技术。

  Stoakley平台可支持现有的65nm制程的Xeon 5100和Xeon 5300处理器,还明确的支持未来的应用了45nm、High-k制程工艺的双核/四核处理器。

  代号为Harpertown的处理器是英特尔的第二代四核处理器,代号为Wolfdale-DP的处理器为双核处理器,它们都是Penryn处理器衍生产品,均采用了45nm High-k制程技术。

  Harpertown处理器配置了2 x 6MB L2缓存,每两个核心共享6MB缓存。从目前英特尔提供的信息来看,Harpertown处理器不再使用1066MHz FSB,开始支持更高的1333MHz/1600MHz FSB。由于采用了45nm High-k制程技术,四核Tigerton的功耗依然保持同现有的双核大致相当的水平,TDP依然为50瓦、80瓦和120瓦。

  Wolfdale-DP双核处理器整合了6MB共享缓存,前端总线为1333MHz,TDP有45瓦、60瓦和80瓦三种,主要的指标同现有的Woodcrest类似。毕竟不是所有的用户都需要四核处理器,因此双核处理器依然会是一条独立完整的产品线。

  新平台的MCH芯片代号为Seaburg,它依然采用了DIB前端总线,工作模式为1066/1333/1600MT/s,可提供17-25.6GB/s的数据传输带宽——这也意味着未来的45nm双核或者四核Xeon处理器的FSB将会达到1600MHz。为了保证双路四核系统的效能,Seaburg整合了容量高达24MB的Snoop filter(探听过滤器)。

  探听过滤器是位于芯片组中的高速缓存标记结构,它可追踪处理器中的高速缓存的高速缓存线状态——只是包括其标签和状态,不包括数据,过滤不必要的探听,帮助多个处理器核心更好的协作,以提升多路处理器系统的工作效率。最早是IBM将Snoop filter功能引入到其X3芯片组中,随后英特尔Blackford芯片组中也引入了该功能——随着处理器从双核向四核的转变,该功能需要进一步优化,以帮助更多的处理器核心协同工作。

  Seaburg整合了4通道FB-DIMM 533/667MHz内存控制器,最高可提供21GB/s的内存带宽。当然,我们不排除细分市场的需要,会有双通道版本的Seaburg。Seaburg所整合的内存控制器最高寻址范围为38bit(128GB),是上一代MCH的一倍。

  Seabury MCH依然通过ESI总线同631x ESB/632x ESB I/O Controller Hub通讯。Intel ESB芯片的开发进度似乎很缓慢,我们分析这应该是同PCIe总线应用越来越多有关,大部分的高吞吐量设备都可通过PCIe总线同MCH通讯,ESB更多的是保持对于传统设备和低速设备的支持。

  Seaburg提供了44条PCIe x1(PCIe 1.x)通道,相比Blackford多出了12条,而且这些PCIe通道均可灵活配置,因此可充分满足连接多个高速设备的需求。Seaburg还提供了两条PCIe x16(PCIe 2.0)通道,可用于支持显卡等设备。

  Stoakley平台还能提供2个千兆以太网端口和1个万兆以太网端口,此外可利用Intel IOP 348处理器实现对于SAS/SATA 3Gb/s设备的支持。

  英特尔计划在2007年下半年发布Stoakley平台。

  注重性能功耗比的Cranberry Lake平台

  Cranberry Lake平台定位于需要优化性能功耗比的双路服务器和刀片式服务器,或者是海淀存储、通信、嵌入式应用系统等需要优化性能功耗比的高密度刀片式服务器。因为它重新采用了DDR2内存,因此我们对于这款新平台格外的感兴趣。

  Cranberry Lake平台可支持现有的65nm制程的Xeon 5100和Xeon 5300处理器和未来的应用了45nm、High-k制程工艺的双核/四核处理器,同Stoakley平台相同。

  Cranberry Lake平台的MCH芯片代号为San Clemente,采用了DIB前端总线,虽然英特尔没有公布前端总线工作频率,但是我们估计会是1066/1333MT/s。在上面的功能示意图中我们没有看到Snoop filter(探听过滤器)。

  San Clemente所整合的内存控制器支持双通道DDR2,理论上内存带宽不会超过12GB/s,同双路四核处理器搭配的话,恐怕会有瓶颈,这也是为什么我们预计其前端总线可能不支持1600MT/s的原因之一。

  我们也注意到了同San Clemente搭配是ICH9R,而并非成本更高一些的ESB 631x/632x,这同该平台定位相符,尽可能的降低该平台的成本和功耗。

  重任在肩的四路Caneland平台

  从单路、双路服务器市场来看,英特尔的市占率还是具有较为明显的优势的。但是,在四路/多路服务器市场上,AMD的市占率近乎一半,凭借老迈的Netburst微架构的Truland平台无力同Opteron竞争。英特尔计划在2007年第三季度发布应用了Core微架构的多路服务器平台Caneland,Opteron终于迎来了一个真正的对手。

  Caneland平台可兼容基于Netburst微架构的Xeon 7000系列处理器,还能支持英特尔即将发布的代号为Tigerton的Xeon 7300系列处理器和代号为Dunnington的处理器。

  Tigerton处理器采用了具有极高效能的Core微架构,可以预见英特尔MP平台的性能将会出现一次突发式提升。每颗双核处理器配置了4MB L2缓存,四核处理器基本上是两颗双核Tigerton处理器的叠加。Tigerton处理器依然采用mPGA604封装,同现有的Xeon MP兼容。

  相对于现有的Xeon 7000/7100系列处理器,Tigerton四核处理器的功耗有了进一步的降低,用于高密度机架式/刀片式服务器的处理器TDP为50瓦,用于机架式/刀片式服务器的处理器TDP为80瓦,性能优化型处理器TDP为130瓦。

  相对于之前的TwinCastle芯片组,Caneland平台所采用的Clarksboro MCH芯片的前端总线有了明显的变化。原来的芯片只能提供两条667MHz/800MHz FSB,而Clarksboro芯片则提供了4条1066MT/s FSB,系统中的每颗处理器终于都有了独立的高速总线。英特尔四路平台不平衡的状态终于得到了改变。

  Clarksrobo芯片组整合了64MB Snoop filter,这比Stoakley平台所使用的Seaburg所整合的24MB Snoop filter大的多,毕竟在这个平台上最多需要安装4颗处理器,总共16个核心。

  Caneland平台终于开始采用FB-DIMM内存,不过Clarksrobo的内存控制器似乎并没有比Seaburg更复杂,它依然是4通道533MHz/667MHz FB-DIMM内存控制器,内存带宽最高不过21GB/s,同前端总线总带宽相比还存在较大的缺口。当安装8GB DIMM模组时,Caneland平台最高可配置256GB的内存。

  Clarksrobo最高可支持28条PCIe x1通道(PCIe 1.x),同样这些通道可灵活的配置为x4、x8,用以连接更高速的设备。如上图所示,Clarksrobo依然需要同ESB2芯片配合使用,如果需要支持GbE、10 GbE、SAS等高吞吐量设备,则需要利用第三方的PCIe扩展器进行扩展。

  多核、新总线、虚拟化,2007服务器平台趋势

  2007年,英特尔服务器平台会全面的升级到四核处理器。DP Xeon会率先利用Penryn处理器技术,推出代号为Harpertown的四核处理器,MP Xeon则终于会引入Core微架构,推出代号为Tigerton的四核处理器。Penryn处理器技术将会利用45nm High-k制程的优势,使得双核DP Xeon升级到四核产品之后保持现有的功耗水平。从Netburst微架构升级到Core微架构之后性能提升幅度之大,我们在PC平台和DP Xeon平台上已经领略过了,因此可以预期MP Xeon平台升级到Tigerton之后性能提升。

  Stoakley平台是目前唯一一个明确会支持PCIe 2.0总线技术的平台。PCIe 2.0总线的数据率加倍,从现有的PCIe 1.x总线的2.5Gb/s升级到了5.0Gb/s,可胜任更大量的数据交换任务;通过链路初始化握手信号实现向上兼容;可支持动态链宽度和速度转换;更准确的超市机制;支持功能级重启(FLR)。

  Stoakley平台还整合了英特尔两个特有的平台技术:英特尔虚拟化技术和英特尔I/OAT2技术(在《直接缓存访问 I/O加速技术2释放更多计算力》一文中我们已经对于I/OAT2技术进行了介绍)。英特尔正在按部就班的推进虚拟化的进程。Bensley平台的初步实现了处理器级的虚拟化硬件辅助(VT-x),使得VMM软件更高效、更简单、更安全。Stoakley平台则实现了IO-设备虚拟化的硬件支持,它可实现设备的DMA再映射,可将I/O设备直接分配给VMs,可通过DMA对设备进行单独控制。

0
相关文章