【IT168 专稿】虽然现在标准化、廉价的PC服务器非常流行,但在那些关系到钱财人命的关键领域的数据中心里,如银行,如航空公司,如电信,却运行着大量的小型机服务器,多年来,X86架构一直难以撼动。这主要得益于RISC小型机非常棒的RAS特性——稳定、可靠、安全,这也是为什么今天非X86服务器以5%左右的销量份额却能占据近一半收入份额的原因所在吧。今年是IT168网站成立十周年,值此之际,IT168服务器频道推出了系列回顾性文章,以梳理服务器产业过去的风风雨雨,从而帮助大家对那些如同璀璨明星一样的企业和产品有了一个历史性的认知和把握。本文回顾了IBM POWER处理器自1990年诞生以来其产品技术不断发展变迁的历程。
系列推荐:
POWER是IBM公司开发的一套RISC指令集架构(ISA),是Performance Optimization With Enhanced RISC的缩写。今天,POWER系列处理器被大量地应用于IBM公司的服务器、小型机、工作站和超级计算机里面。
POWER 芯片起源于 801 CPU,是第二代 RISC 处理器。POWER 芯片在 1990 年被 RS 或 RISC System/6000 UNIX 工作站 (之后的eServer 和 pSeries,现在的Power Systems)采用,POWER 的产品有 POWER1、POWER2、POWER3、POWER4、Power5,现在最高端的是 POWER6。主频高达5GHz的POWER6 处理器是目前单个芯片中性能较好的芯片。
RISC的诞生:801计划
早在1974年,IBM启动了一项研发计划,其目标是要构建一个大型的电话交换网络,要求可以满足每秒钟至少处理300个电话的要求。由于每次处理一个电话时需要执行2万条机器指令,同时要保证实时的响应,因此,研发人员认为处理器的速度至少需要达到12 MIPS。在当时的情况来看,这个要求是高得难以想象的。不过,研发人员也认识到,当时的CPU比较复杂,应该可以精简,因此这套机器只需要处理I/O、寄存器间寻址,把数据在寄存器和内存之间进行传输,而并不需要那些特殊的指令来进行大量的数学运算。
这一简单的设计思想,即一次复杂操作的每一步都由单一的机器指令来执行,然后所有指令都要在相同的时间内完成,最终变成了现在大家都熟知的RISC。到1975年,这个电话交换项目甚至没等到原型出来就被取消了。不过,经过那一年前的研发测试,研究人员发现,针对这个项目设计的处理器非常有希望成为一种通用的处理器,因此,处理器的研发工作继续在IBM Thomas J. Watson研究中心的801大楼进行,即“801”计划。
精简指令集(RISC)技术,以指令硬件译码、长度一致的指令集(例如 32位)和相同的指令执行时间(一个时钟周期)为代表的全新设计思想和处理器架构开创了微处理器结构的一片全新天地。由于其优化的指令系统带来的运算速度的提高等优势,使得RISC技术在80年代后期,逐渐在高端服务器和工作站领域中取代了CISC (Complex Instruction Set Computing,复杂指令集计算)成为主流的微处理器设计架构之一(见下表)。
随着RISC架构的提出,各个具备一定技术实力的厂家开始在这个架构的基础上研发出自己的处理器,经过近二十年的发展,生产芯片的厂家经历了各种分分合合,到目前为止,我们见到的主流RISC芯片主要有PowerPC、SPARC、PA-RISC、MIPS等,这些芯片分别由重要的服务器厂商用来作为其高端服务器产品和工作站的核心。几乎无一例外地,各种大型计算机和超级服务器都采用RISC架构的处理器,RISC处理器已经逐渐成为高性能计算机的代名词,这也就是我们平时所指的Unix服务器阵营。下面,我们就和大家一起回顾一下最牛RISC处理器——IBM POWER家族的发展历程。
POWER1
到了1990年2月,IBM推出了第一台使用POWER架构的计算机,名为RISC System/6000,或RS/6000。RS/6000在POWER体系的多芯片实施的基础上,在IBM RISC System/6000 技术中称为SA23-2619。参照最近的芯片发展历程,这项技术现在一般被称为POWER1。这款芯片集成了 80万个晶体管,引入了8KB指令缓存(I-cache)和32 KB 或 64 KB数据缓存(D-cache)。他们有一个独立的浮点单元能够处理一个混合浮点叠加操作(FMA) 在每个循环里,在潜伏期里只有两个循环。
图:入门级工作站RS/6000 32H上使用的POWER CPU
因为,峰值的MFLOPS等于MHz值的两倍。例如:型号530是一个桌边工作站工作主频25MHz,带有一个高峰时的性能值50 MFLOPS,通常发生的数字式的内核能够获得的性能值和理论的峰值非常接近。在1992年,型号220发布,在POWER体系的单芯片实施的基础上,通称为RISC 单芯片(RSC)。他被设计为一个低成本,入门级的桌面的工作站,包含一个单8KB混合指令和数据缓存。
与当时其他的 RISC 处理器不同,POWER1 进行了功能划分,这为这种功能强大的芯片赋予了超量计算的能力。它还有单独的浮点寄存器,可以适应从低端到高端的 UNIX 工作站。最初的 POWER1 芯片实际上是在一个主板上的几个芯片;后来很快就变成一个 RSC(RISC 单一芯片),其中集成了 100 多万个晶体管。POWER1 微处理器的 RSC 实现被火星探险任务用作中央处理器,它也是后来 PowerPC 产品线的先驱。
最后的POWER1机器,在1993年9月发布,是型号580。它的主频62.5MHz并带有32KB I-cache 和64 KB D-cache。
PowerPC
1991年,IBM有了一个大胆的计划,就是让POWER变得更普及:从靠电池驱动的手持设备到超级计算机和大型机,为此,IBM计划向其他系统制造商制造和销售这一芯片。IBM找到了苹果公司,共同合作开发一种基于POWER架构的单芯片微处理器。不久之后,由于苹果公司也在长期、大量使用摩托罗拉公司的桌面级微处理器,于是,苹果邀请摩托罗拉公司加入了这一项目,而且摩托罗拉公司比IBM在制造可量产的微处理器方面更有经验。这三家公司的合作基地们于美国得州的奥斯汀市,被称作AIM联盟,AIM即Apple, IBM, Motorola的缩写。
经过两年时间的联合开发,在1993年,源自于POWER架构的一个修正版本PowerPC诞生了。PowerPC 中的 PC 代表 performance computing。PowerPC架构增加了单精度浮点计算指令,以及通用寄存器乘除法指令,还修改了POWER的一些特性,如使用MQ寄存器的特殊的乘除法指令。此外,PowerPC还增加了64位版本,并提供了对SMP系统的支持。
PowerPC 600 系列
PowerPC 601 是第一代 PowerPC 系列中的第一个芯片。它是 POWER 和 PowerPC 体系结构之间的桥梁,其与 POWER1 的兼容性比以后的 PowerPC 都要好(甚至比 POWER 同一系列的芯片还要好),同时它还兼容 Motorola 88110 总线。PowerPC 601 的首次面世是在 1994 年最早的 PowerMac 6100 中,其主频为 66 Mhz。这条产品线中的下一个芯片是 603,它是一个低端的核心,通常在汽车中可以找到。它与 PowerPC 603 同时发布,当时 PowerPC 604 是业界最高端的芯片。603 和 604 都有一个“e”版本(603e 和 604e),该版本中对性能进行了改善。最后,第一个 64 位的 PowerPC 芯片,也是很高端的 PowerPC 620 于 1995 年发布。
PowerPC 700 系列
首次面世是在 1998 年,PowerPC 740 和 PowerPC 750 与 604e 非常类似 ,有些人会说他们是同一个 600/700 系列的成员。PowerPC 750 是世界上第一个基于铜的微处理器,当它用于 Apple 计算机时,通常称为 G3。它很快就被 G4(或称为 Motorola 7400)所取代了。32 位的 PowerPC 750FX 在 2002 年发布时其速度就达到了 1GHz,这在业界引起一片哗然。IBM 随之在 2003 年又发布了 750GX,它带有 1MB 的 L2 缓存,速度是 1GHz,功耗大约是 7 瓦。
PowerPC 900 系列
64 位的 PowerPC 970,这是 POWER4 的一个单核心版本,可以同时处理 200 条指令,其速度可以超过 2GHz,而功耗不过几十瓦。低功耗的优势使其一方面成为笔记本和其他便携式系统的宠儿,另一方面又成为大型服务器和存储设备的首选品。它 64 位的处理能力和单指令多数据(SIMD)单元可以加速计算密集型的应用,例如多媒体和图形。这种芯片用于 Apple 的桌面系统、Xserve 服务器、图像系统以及日益增长的网络系统中。Apple Xerve G5 是第一个装备 PowerPC 970FX 的机器,这是第一个采用应变硅和绝缘硅技术制造的芯片,可以只需更低的功耗就实现更高的速度。
PowerPC 400
这是 PowerPC 处理器中的嵌入式系列产品。PowerPC 的灵活性体系结构可以实现很多的专用系统,但是从来没有其他地方会像 400 系列一样灵活。从机顶盒到 IBM 的“蓝色基因”超级计算机,到处都可以看到它的身影。在这个系列的一端是 PowerPC 405EP,每个嵌入式处理器只需要 1 瓦的功耗就可以实现 200 MHz 的主频;而另一端是基于铜技术的 800 MHz 的 PowerPC 440 系列,它可以提供业界最高端的嵌入式处理器。
每个子系列都可以专用,例如,PowerPC 440GX 的双千兆以太网和 TCP/IP 负载加速可以减少报文密集型应用对 CPU 的占用率 50% 以上。大量的产品都是在对 PowerPC 400 系列的核心进行高度修改而构建的,其中“蓝色基因”超级计算机就在每个芯片中采用了两个 PowerPC 440 处理器和两个 FP(浮点)核心。
POWER2
发布于1993 年,一直使用到 1998 年,每个芯片中集成了 1500 万个晶体管,POWER2 芯片中新加了第二个浮点处理单元(FPU)和更多缓存。P2SC 超级芯片是 POWER2 这种 8 芯片体系结构的一种单片实现,使用这种芯片配置的一个 32 节点的 IBM 深蓝超级计算机在 1997 年击败了国际象棋冠军 Garry Kasparov。
第一款POWER2 机器包括:主频55 MHz 的型号 58H ,主频71.5 MHz 的型号990 ,对于科技应用最关键的改进在于引入了POWER2 体系,增强了浮点运算单元,包含了64 位的执行单元。而且,两个浮点叠加指令能够在每个循环里被执行。而且还提供了第二个固定运算单元。另外,一些新的硬件指令集被引入POWER2 : Quad-word 存储指令集,quad-word 导入指令移动两个相邻的双精度(double-precision )值;到两个相邻的浮点寄存器;硬件平方根指令集;浮点到整数转换指令集。
尽管型号590 运行在一个比基于POWER1 体系的型号580 稍快一点的时钟频率,由于上面所列的架构体系的改进,配合有更大的256 KB D-cache ,使得型号590 在性能上有出色的表现。
在1996 年10 月,IBM 发布RS/6000 型号 595 ,这是第一款基于P2SC (POWER2 Super Chip) 芯片的机器。象它的名字暗示的一样,这是一款单芯片POWER2 机器,时钟频率有更大幅度的增加,型号 595 主频 135 MHz 。 最快的P2SC 芯片,是型号397 工作站和RS/6000 SP Thin4 节点,它的主频是160 MHz ,是640 MFLOPS 的理论峰值速率。
RS64
第一个RS64 芯片发布于1997 年9 月,是RS/6000 跨入64 位计算的第一步,这系列的产品强调更强的商业服务器性能。它的主频是125 MHz ,2 颗CPU, 4MB L2 缓存和拥有64 KB L1 指令缓存, a 64 KB L1 数据缓存, 一个浮点单元,一个load-store 单元,一个floating-point 单元 , 一个 integer 单元,系统最多可配置12颗CPU。 使用RS64 的pSeries 产品是第一批使用和iSeries 产品的相同的CPU 和内存的系统。
1998 年9 月,发布RS64-II ,它的设计不同于RS64 ,时钟频率达到262 MHz ,L2 缓存可以达到 8 MB ,它有一个 64 KB L1 指令缓存,一个 64 KB L1 数据缓存, 一个 floating-point 单元,一个 load-store 单元,两个 integer 单元, 和一个 short in-order pipeline 对于优化的conditional branches 。
1999 年秋天,RS64-III 发布,设计采用铜芯片技术,主频达到450 MHz , L1 指令和数据缓存都分别增加到128 KB 。这款芯片在AIX 环境下支持硬件多线程。系统设计最多可达到24 颗CPU 。
2000 年秋天,设计增加了缘上硅(SOI) 技术,主频达到600 MHz , L2 缓存增加到 16 MB 在一些机型上,之后推出主频 750 MHz 的芯片,最近的这款芯片的版本是 RS64-IV 。
POWER3
发布于 1998 年,每个芯片中集成了 1500 万个晶体管。第一个 64 位对称多处理器(SMP),POWER3 完全兼容原来的 POWER 指令集,也可以与 PowerPC 指令集很好地兼容。POWER3 设计用来从事从太空探测到天气预报方面的科技计算应用。它特有一个数据预取引擎,无阻塞的交叉数据缓存,双浮点执行单元,以及其他一些很好的设计。POWER3-II 使用铜作为连接介质重新实现了 POWER3,这样以相同的价格可以获得两倍的性能。
RS/6000 44P 270上的IBM POWER3-II处理器
POWER3 芯片吸取了设计POWER2、P2SC 芯片以及 PowerPC 体系架构的精华,它具有很好的浮点(floating-point)运算性能,因为沿用了P2SC 的两个浮点运算单元,同时作为一个 64 位, SMP-enabled 芯片最终能够具有比现有的P2SC 芯片更高的主频。1998 年发布的芯片的主频是200 MHz ,这款芯片的最近发布的使用铜芯片技术,主频最高达到450 MHz 。
POWER4
1999年 10月,IBM 率先在微处理器论坛中批露了其双核心Power4 的研发计划,工程样本于 2000年 1月研制成功,POWER4 芯片是业界第一个双内核处理器,每个芯片中集成了 1 亿 7400 万个晶体管。采用 0.18 微米的铜和 SoI(绝缘硅)技术,POWER4 是当时市场上单个芯片功能最强大的芯片。POWER4 继承了 POWER3 芯片的所有优点(包括与 PowerPC 指令集的兼容性),但是采用的却是全新的设计。每个处理器都有 2 个 64 位的 1GHz+ 的PowerPC 核心,这是第一个单板上具有多核心设计的服务器处理器(也称为“片上 CMP”或“片上服务器”)。每个处理器都可以并行执行 200 条指令。POWER4+(也称为 POWER4-II)功能与之类似,但是主频更高,功耗更低。早期的POWER4处理器主频为1.1和1.3GHz,到了POWER4+版本,主频提升到了1.9GHz。
POWER4 芯片增加了L3 缓存 ,fabric controller 可以控制在L2和L3 之间以及单个处理器之间的信息流和数据。每个微处理芯片包含64 KB L1 指令缓存 , 一个 32 KB L 1 数据缓存,两个 fixed-point 执行单元 , 两个浮点执行单元, 两个 load/store 执行单元,一个分支执行单元 , 和一个执行单元来进行逻辑操作在一定条件下。 在程序组按顺序分发的指令由执行单元按非程序顺序处理,最老的操作具有高的优先级。分组能够最多包含5 个指令,通常被一个branch 指令终止。
和POWER3一样,POWER4也是一款全64位处理器,可以执行完整的PowerPC指令集,它也可以用于RS/6000和AS400系统当中,从而取代了POWER3和RS64处理器。当时,IBM还发布了一个新的ISA,名为PowerPC 2.00 ISA,增加了几条扩展指令。POWER4芯片能够在1秒钟时间内把100G数据——相当于20部DVD电影的数据,从2级缓存传送到CPU。
在制造工艺上,POWER4芯片采用了先进的铜芯片和绝缘硅技术, 铜芯片的问世可以说开创了服务器技术的一个新的历史纪元。铜的采用使单位面积硅片具有更高的集成度、更小的功耗、更高的工作频率。绝缘硅则能将更多的硅和硅氧化层添加到处理器中,用于绝缘。具体来讲,它是在处理器芯片内部的硅晶片上先嵌埋一层二氧化硅绝缘物,再以这一绝缘物作为基板来制造各个晶体管,通过绝缘的氧化层起到保护芯片上数百万个晶体管的作用,减小晶体管的静电电容,而使晶体管的状态切换加快,降低了误差、提高了晶体管的工作效率以及微处理器的速度;同时,减小了状态切换时的充电电流,以降低功耗,延长了设备的实用寿命。POWER4还采用先进的多芯片模块 (MCM) 封装 (下图),可以在手掌大小的地方安装最多可达 8 个的 POWER4 处理器。每一模块连接的多达128MB外部级 (L3)高速缓存使性能进一步得到了提高。
POWER5
含有4个POWER5 die和4个36MB L3缓存的MCM
于2004 年4月发布。与 POWER3 和 POWER4 芯片类似,POWER5 是 POWER 和 PowerPC 体系结构的一种综合体。这种芯片具有很多特性,例如通信加速、芯片多处理器、同步多线程等等,POWER 5作为新一代的64位微处理器,除了在性能方面得到明显提高外,在可扩展性、灵活性和可靠性方面也有所加强。基于Power 4及Power 4+的设计,双核心POWER 5增加了并发多线程能力(SMT),可以将一个处理器转变为两个处理器,所以可以执行4个逻辑处理器,从而允许一个芯片同时运行两个应用,由此大大降低了完成一项任务所需要的时间。一个POWER5系统最终将支持多达64个处理器,这样从软件运行角度来看,就好像是128个处理器在工作。
POWER5芯片具有2.76亿个晶体管,比最初的POWER4芯片(具有1.74亿个晶体管)多1亿个。 芯片面积为389平方毫米,包括2313个信号I/O和3057个电源I/O。POWER5也向ISA增加了一些指令。随后的POWER5+进一步增加了更多的指令,将ISA升级到2.02版本。 POWER5的设计是IBM系统设计师、芯片架构设计师、软件工程师和技术人员紧密协作的成果。它所采用的基础技术有效保证了IBM eServer服务器在占用更小的空间(通过逻辑分区实现)的条件下为客户提供更高的性能。
POWER6
目前IBM服务器中大量使用的POWER6处理器于2007年5月21日发布。它向POWER家族增加了VMX,并引入了第二代IBM ViVA(ViVA-2),这是自POWER3升级到POWER4那会以来POWER家族最大的一次变化。基于65纳米工艺制造的POWER6不仅也采用双核心设计,而且它的主频高达5.0 GHz。POWER6还拥有了非常先进的芯片间通信技术。另外,其功耗也几乎与前代的POWER5相当,但性能却翻了一番。
作为POWER5的继任者,POWER6微处理器是IBM eCLipz计划的成果,该计划的目的是为了将过去IBM三大产品系列——i系列、p系列和Z系列服务器硬件整合到相同的POWER平台上面来。POWER6于2007年5月21日正式发布。
POWER6大约集成了7.9亿颗晶体管,大小为341平方毫米,采用65纳米制程工艺。2007年6月8日IBM推出的POWER6主频为3.5GHz、4.2GHz和4.7GHz,2008年5月,IBM推出了主频5.0GHz的POWER6芯片,不过,IBM也曾透露过,POWER6其实可以做到6GHz。
该芯片采用双核心设计,拥有128KB L1缓存(其中64KB数据和64KB指令)。每个内核拥有一个4MB的“半共享”L2缓存,即该缓存虽然被分配给某个内核,但其余内核也可以快速地访问它。POWER6的两个内核拥有32MB大容量L3缓存,不过是off die的,中间通过80GB/s的总线连接。
每个内核拥有2个整数单元、2个二进制浮点单元,还有一个全新的十进制浮点单元,可以实现两路同步多线程(SMT)。
POWER6还有一个能够加速许多多媒体任务的AltiVec单元,完全兼容Power ISA v2.03指令集。通过对多个数据元素执行同一条指令,AltiVec能够提高处理器的数据处理效率。这将有助于台式机执行音频和视频任务,而服务器在运行基因数据处理等高性能计算任务的效率也会提高。
POWER6也利用了ViVA-2(虚拟矢量架构,Virtual Vector Architecture),可以将多个POWER6节点整合起来用作单一的矢量处理器。
通过两个节点连接通道(50GB/s),POWER6可以连多达31个处理器,每核支持10个逻辑分区(每系统可以达到254个分区)。POWER6还包括了许多用于增强可靠性、改善能效的创新技术,如将大型主机中的一些高端可靠性特性移植到了Power6,旨在在软件停止运行前发现和修正尽可能多的漏洞。在每个时钟周期,芯片内核会记录它存储的全部数据。
为了满足不同应用的需求,IBM没有推出不同版本的POWER6处理器,而是通过芯片的可定制化配置来实现,如0,1或2个片上L3缓存控制器、1或2个片上内存控制器等。
截止到2008年,IBM使用POWER6的服务器包括Express系列的520、550和560,Enterprise系列的570和595。这些不同型号的服务器可以满足不同规模的客户需求。比如,520 Express主要针对中小企业,而Power 595则是面向大型、多任务处理的数据中心。在Express和Enterprise之间的区别主要在于,后者包含了CUoD(Capacity Upgrade on Demand,按需扩展)和热插拔处理器/内存等特性。
此外,IBM还提供支持POWER6的刀片服务器——JS12和JS22。JS12配置两个3.8GHz POWER6内核,而JS22有4个4.0GHz的内核。这些刀片都支持AIX、i和Linux操作系统。刀片机箱BladeCenter S和H都可以支持运行这三类操作系统的刀片,而BladeCenter E,HT和T机箱只能支持AIX和Linux,不能支持i操作系统。
在2007年的国际超算大会SC07上,IBM又推出了一款新的采用水冷技术的Power 575。575由多个2U节点组成,每个节点配置32个4.7GHz的POWER6内核、最大内存为256GB,即在一个575机柜中,可以最多支持448个核。
POWER7
POWER7目前还在开发当中,预计在2010年发布,将会是Peta级别的第一款产品。据称,POWER7的研发单位包括IBM的Rochester、Austin和Böblingen多个实验室。
POWER7已经被DARPA选中,用于他们的千万亿次超级计算机。早在2006年11月,IBM从DARPA(美国国防部高级研究规划局,,Defense Advanced Research Projects Agency)赢得了一个金额高达2.44亿美元的合同,用于在2010年底之前开发出千万亿次级的超级计算机(petascale supercomputer)架构。该合同也同意该架构可以转为商用。IBM当时提出的方案是PERCS,即高生产力、易用、可靠的计算机系统(Productive, Easy-to-use, Reliable Computer System),正是基于POWER7处理器、AIX操作系统和通用并行文件系统进行构想的。虽然现在有传言说POWER7和AMD未来的Opteron处理器会共用相同的CPU Socket,但从未得到了IBM或AMD公司的官方证实。
据了解,POWER7的规格主要有:使用45纳米工艺,早期主频为4.04GHz,每个MCM(Multi Chip Module)上有两个芯片,每芯片拥有8个内核,每个内核可以执行4个线程,即每个MCM有16个内核、64个线程,可见Power 7是一款面向多核、多线程的处理器。跟POWER6相比,Power7无论生产工艺、核心数量、浮点性能都会大有提升,在能耗相同的情况下可以将性能提高1-2倍。。在计算性能上,每个核是32.3GFLOPS,每个芯片是258.6GFLOPS,每个MCM是517.1GFLOPS。
另外,据称,系统由Power6升级到Power7相当方便,只需更换集成有处理器和内存的模块即可。IBM的软件可以确保系统运行不会中断,使升级变得更为简便易行。
附:1980-2006年POWER架构大事记
1980年
IBM 发布了第一台基于 RISC(精简指令集计算机)架构的原型机。早在上世纪 70年代初,基于 IBM 科学家 John Cocke 的发明,RISC 的理念大大简化了计算机操作指令,加快系统运行速度,使得计算机性能得到大幅度提升。如今,RISC 架构已经广泛应用于众多工作站和 UNIX 服务器系统中,并被看作是未来主流的计算架构。
1990 年
IBM 推出基于 RISC 系统、运行 AIX V3 的新产品线 RS/6000(现在称为 IBM eServer p 系列)。该系统架构后来被称为 POWER(POWER1),意为增强 RISC 性能优化(Performance Optimization With Enhanced RISC)架构。
1991年
IBM 和苹果、摩托罗拉公司达成一系列合作协议,内容包括:推出支持苹果 Macintosh 个人电脑与 IBM 网络相连的全新产品;推出面向 PC 机和低成本工作站的 RISC 架构 PowerPC 处理器;形成一个开放的系统环境,保证 IBM AIX 和苹果 Macintosh 软件程序在两家公司设计的 RISC 系统中都能运行。此外,开放的系统环境包括其他一些技术协议。
1993 年
IBM 推出可升级的 POWER 并行系统,这是第一款采用 RS/6000 技术,基于微处理器的超级计算机。在该系统中,IBM 首次应用多处理器技术,可将复杂密集的任务进行分解,大大加快了计算机的运算速度,开创了业界先河。
IBM 和摩托罗拉公司推出 PowerPC 601 处理器,该处理器是与苹果共同开发的。PowerPC 上集成 280 多万个晶体管,主频为 50 MHz。 IBM 还发布了 66 MHz 的 POWER2 处理器,首先应用于 RS/6000 系统。
1994 年
IBM 推出可升级的 POWER 并行系统 2 (Scalable POWERparallel,SP2)。美国康乃尔理论研究中心配备了 SP2 超级计算机,运行速度高达 1360 亿次/秒。欧洲粒子物理学实验室(CERN)采用一款64节点、运行 AIX 系统的 IBM SP2,速度位于欧洲前列。
IBM 成功研发出新一代 PowerPC 604 处理器,其强大的处理性能在批量生产的处理器产品中处于领先地位。IBM 技术人员还推出了业内最快的“无损”数据压缩芯片,每秒钟能处理 40 MB 数据。
7 月,IBM 交付第一百万个 PowerPC 601 处理器。
IBM还发布首个基于 Power 架构的嵌入式控制器 PowerPC 403GA。
1995年
PowerPC64 位 RISC 处理器开始应用于 IBM AS/400 操作系统中。 8 月,苹果公司推出首款基于 Power 架构的笔记本电脑 PowerBook 500,它采用 IBM 的 PowerPC 603e 处理器 。
1996年
IBM 推出全新的 32 位 POWER2 超级芯片(P2SC),主频达 135 MHz ,首先应用于 RS/6000 系统。基于 POWER2 架构的 P2SC 采用了高密度 CMOS 技术,单个芯片上集成 1500 万个晶体管。
1997年
IBM“深蓝”超级计算机在经过多局较量后,击败了国际象棋冠军 Garry Kasparov。“深蓝”是一款 32 节点的 IBM RS/6000 SP 计算机,处理器采用 32 位 P2SC,运行 AIX 操作系统。在比赛期间,“深蓝”的平均运算速度为每秒 1 亿 2600 万步。目前,这台超级计算机被安放在美国华盛顿特区的史密森国家博物馆内。 IBM 为美国国家宇航局提供一款 32 位的 PowerPC 微处理器,其运算速度可达每秒 3500 万次,主要用于火星探测计划。经过洛克希德马丁实验室改造后,最终形成可抗辐射的 RAD 6000 芯片,植入火星登陆车 Sojourner Rover 内部的计算机系统中。
1998年
由 IBM 和美国劳伦斯利弗莫尔国家实验室共同研发的“蓝色太平洋”超级计算机问世。这台计算机采用 PowerPC 604 处理器,主频高达 332 MHz,系统包含 176 个节点,最高运算速度为每秒 3.9 万亿次(比一般台式电脑快 1.5 万倍),存储容量超过 2.6 TB (是普通 PC 机的 8 万倍)。“蓝色太平洋”一秒钟内的计算量相当于一个人使用计算器连续计算 6 万 3 千年的总和。
IBM 推出世界上第一组基于铜的微处理器 PowerPC 740/750,工作频率为 400 MHz。由于使用了铜芯片技术,处理性能提高了近 1/3。
全新 64 位 POWER3 处理器将 POWER2 架构(P2SC) 与 PowerPC 架构相结合,并对技术应用进行了优化。POWER3 的最高运算速度可达每秒 200 万次,比“深蓝”所采用的 POWER2 超级芯片快出一倍多。
IBM 还公布了首个基于 Power 的嵌入式系统芯片(SoC)内核。不久之后,PowerPC 405 内核也将同其他 IP 相结合,形成嵌入式 SoC 微处理器和基于 Power 的特定应用集成电路(ASIC)解决方案。
1999年
IBM 研究院投资 1 亿美金开发一种新型的 Power 架构超级计算机。这种名为“蓝色基因”的计算机峰值速度超过 1 Peta FLOP,比当时最快的超级计算机高出 500 倍。它将被用来模拟复杂蛋白质的折叠。
自正式推出铜芯片一年后,IBM 交付了第一百万个铜技术 PowerPC 芯片。 6 月,IBM 发布了第一个基于 405 内核的系统芯片 PowerPC 405GP。下半年,IBM 即推出了再下一代嵌入式 PowerPC 内核。
IBM 与任天堂公司共同宣布了一项价值 10 亿美元的技术协议,IBM 将为任天堂的下一代家庭游戏机 GAMECUBE 提供增强版 PowerPC 芯片。新产品性能将超出任何其他家庭游戏系统,为玩家呈现更佳的图像效果和更逼真的动作画面。
2000年
IBM 宣布将高速 PowerPC 处理器与电视机顶盒(STB)组件一起整合到一个“单芯片系统”上,从而在系统性能、价格和设计等方面为机顶盒厂商带来竞争优势。该单芯片系统拥有众多的先进应用,并能帮助三星等公司灵活应对不断变化的客户需求。 同年,IBM 将 RS/6000 更名为 IBM eServer p 系列。
2001年
IBM 新一代超机计算机“ASCI White”在美国劳伦斯利弗莫尔国家实验室投入使用,运算速度高达每秒 12.3 万亿次,主要用于模拟核爆炸试验。作为美国国家核安全管理局 (NNSA)提高战略运算能力计划(ASCI)的组成部分,该系统强大的运算能力可以在不到 1 分钟时间内处理地球上每个人发出的一次互联网操作请求。
在经过 5 年潜心研发后,IBM 推出世界上最强大的 UNIX 服务器— eServer p690(“Regatta”)。新系统基于先进的 POWER 4 处理器,集成了多项主机技术。由多台 p690 服务器连接而成的超级计算机拥有 1000 多个 POWER 4 处理器,能够完成最为复杂的运算任务。
索尼、东芝和 IBM 宣布合作,共同开发一种用于宽带设备的高级芯片架构,这款代号为“CELL”的芯片将采用业界非常先进的芯片研发和制造技术。应用该产品的设备性能将超过 IBM“深蓝”超级计算机,并能以更低的功耗实现超高速宽带上网。
2002年
IBM 推出 64 位 PowerPC 970 处理器, 这款高性能产品可应用于普通台式机、入门级服务器等多种环境中。64 位的 PowerPC 970 芯片基于 POWER 4 服务器架构,采用独特的单指令多数据流(SIMD)单元,拥有超强处理性能。此外,它还采用了“Elastic I/O”内部总线结构,这是业界最快的处理器总线之一。
IBM 推出速度更快的 POWER4+ 。截至 2003 年,POWER4+ 已经应用于全部 pSeries 产品线。
IBM 推出 32 路 eServer iSeries 890 服务器,其处理性能为 i840 的两倍,采用 1.3 GHz POWER 4 处理器,单个芯片上集成了 1 亿 7400 万个晶体管。
IBM 还推出嵌入式 PowerPC 440GP 和 PowerPC 440GX 处理器,主要运行嵌入式网络和存储应用。PowerPC 440GX 拥有 TCP/IP 负载加速功能,在全部的 5 项 EEMBC 基准测试中得分均高于任何其它的“单芯片系统”处理器。
2003 年
IBM 宣布一个有关 32 位嵌入式 PowerPC 内核的公开授权计划。
IBM 和苹果公司联手推出世界上第一款 64 位台式机处理器—PowerPC G5,工作频率达 2.0 GHz。苹果公司称新的 Power Mac G5 电脑是“世界上最快的个人电脑”。
IBM 宣布推出划时代的“Blue Gene/L”原型机。这款超级计算机尺寸仅相当于 30 英寸彩电大小,它的问世将为科学界和 IT 业发展带来深远影响。最终版“Blue Gene/L”超级计算机将于 2005 年诞生,占地面积相当于半个网球场,总共包含 65536 个节点(PowerPC)和 64 个机架,预计其峰值速度将达到 360 Tera Flops。
IBM 宣布 eServer pSeries 630 将采用 POWER4+ 处理器。等到 eServer pSeriesp615 发布后,POWER4+ 已经应用于全部 pSeries 产品线。
IBM 推出首款采用 64 位 PowerPC 技术的刀片服务器 BladeCenter JS20,扩大了客户的选择范围,提高投资回报率,实现快速经济的计算性能扩展。
IBM 推出全新的 PowerPC 750GX。与 PowerPC 750 相比,新产品的二级缓存扩大了一倍,由原先的 512KB 变为 1MB。
2004年
IBM 宣布开发出一种制造低功耗、高性能微处理器的新方法,首次把绝缘硅(SOI)、应变硅和铜制程三种技术工艺结合在一起。64 位 PowerPC 970FX 成为首款采用新技术生产的处理器产品,并在业内评选中荣获大奖。
IBM 交付第 4000 台 eServer p690 服务器,该产品基于 POWER 架构,是世界上最受欢迎的 UNIX 服务器。
IBM 发布“Power Everywhere”战略,围绕 POWER 架构开展一系列合作计划,并建立 POWER 技术创新社区。从全球最强大的企业系统、超级计算机到普通游戏机、嵌入式设备,POWER 架构已经广泛应用于各类产品中。
索尼公司宣布取得 IBM Power 处理器架构授权。索尼表示,POWER 产品丰富的功能和低功耗、高性能的特点将使其成为客户设备的首选。
IBM 推出业界首款基于 Power 架构的刀片服务器—eServer BladeCenter JS20。
IBM 在全球范围内建立 Power 架构中心,为客户设计 POWER 系统提供支持。
IBM 推出一项创新的软件技术,帮助客户开发先进的 Power 架构处理器,并对设计流程进行整合,以实现更快速、更经济的研发目标。
IBM 正式发布新的 eServer i5 服务器,这是世界上第一台采用 POWER5 处理器的服务器产品。具有划时代意义的 POWER5 是 IBM 有史以来最强大的 64 位处理器。
IBM 推出基于 POWER 5 处理器的 OpenPower 720 服务器,相对于 HP 和 Sun 的入门级 UNIX 和 Linux 系统而言,这款 Linux 专用服务器有着明显的价格优势。
IBM 在其 developerWorks 网站上(www.ibm.com/developerWorks) 开辟了 Power 架构技术专区,为众多基于 POWER 平台的芯片设计人员、验证工程师、嵌入式系统及软件研发人员提供丰富的技术资源。
IBM 推出基于POWER 架构的 TotalStorage DS6000 和 DS8000 存储系统。
IBM 推出三款全新的 POWER 5 服务器,树立起高端计算领域的新标准。其中,IBM eServer p5 595、eServer i5 595 拥有强大的处理性能和虚拟能力,而 32 路的 IBM eServer p5 590 和 eServer pSeries p690 相比,速度高出 45%,价格则降低 45%。
在网络设备市场上,Power 架构服务器占据了三分之二的市场份额。
自 2004 年 4 月以来,已有超过 1400 名研发人员加入了 Power 架构团队。
IBM“Blue Gene/L”超越日本 NEC 公司的地球模拟器,成为世界上速度最快的超级计算机。在Linpack基准测试中,IBM“Blue Gene/L”系统的性能达到 360 Tera Flops,刷新了地球模拟器在 2002 年创造的 35.86 Tflop 的世界记录。
在全球排名前 10 位的超级计算机中,共有 5 台采用了 Power 架构,比第二位高出一倍。
IBM 预发布新的高密度 POWER 5 服务器系统— IBM eServer p5 575。该产品可以通过简单的集群方式组成高性能超级计算机,为未来超级计算机的发展指明了方向。
IBM 宣布,基于 POWER 5 处理器、运行 DB2 通用数据库的 IBM eServer 服务器在 TPC-C 基准测试中突破了每分钟 300 万次的处理极限,创造了新的世界纪录。
2005年
10 月,IBM 发布 System p5 产品线,采用基于POWER5处理器的增强版——POWER5+处理器,并提供一系列更优化功能。产品一经推出,就打破 15 项计算领域的世界纪录。
新的POWER5+处理器被称为“片上服务器”(server on a chip),它包括 2 个处理器,一个高带宽系统交换器,一个更大高速缓存和 I/O 界面。最新的 POWER5+有 1.5 和 1.9 GHz 两个主频选择,最大 72 MB 板上高速缓存,支持逻辑分区技术,可使 System p5 为用户提供更强大性能,而占用面积更小。
发布 QCM 技术,即四处理器内核模块。
2006年
2 月,发布破多项记录的 System p5 中端产品,最大限度满足用户对产品不同定位的需求。截至本次发布,System p5 产品所取得的世界记录已经达到 70 余项,其动力主要来自以全新 2.2 GHz POWER5+处理器为代表的 POWER 处理器,和显著提高计算密度的 QCM(4 内核处理器模块)处理器封装技术,后者可使产品在紧凑空间中成倍增加了计算能力。