【IT168 白皮书】在融合传统小型机诸多优点的基础上,曙光推出的第二代小型机(基于8-32颗处理器的高性能64位服务器)在多元操作系统支持、易管理性、兼容性、可扩展性、高性价比等方面取得了新的突破,集“RISC服务器般的性能”与“PC服务器般的价格”于一身,无疑将对昂贵无比的传统小型机造成前所未有的冲击。由于曙光二代型机大部分案例应用于数据库系统,并且因为数据库系统本身的复杂性和二代小型机对一些操作系统的特殊要求,所以本方案基于曙光二代型机设计了最通用的Oracle数据库的解决方案。通过本方案用户首先可以了解到曙光二代小型机相对于传统小型机的优势及特点,曙光二代小型机的主要应用领域。接着分别介绍了基于二代小型机的数据库单机系统、数据库双机高可用系统和数据库多机集群系统,从中可以了解到在不同系统架构中,基于不同型号的二代小型机对操作系统和数据库系统的具体需求,对应用于数据库系统的二代小型机方案具有很好的指导作用。
关键词:传统小型机、曙光二代小型机、数据库、Oracle9i、Oracle10g、Oracle RAC、ROSE HA
1. 曙光二代小型机的行业应用特点
1.1. 曙光二代小型机和传统小型机的简介
小型机:英文名叫做Server,小型机其名是国内的习惯称呼。它是介于大型主机和PC Sever之间,其价格远低于大型主机,性能高于PC Sever,处理器个数在8-32之间一种高性能 64 位计算机。传统的小型机采用RISC、MIPS处理器,支持UNIX操作系统,具有高运算处理能力、高可靠性、高服务性、高可用性等优良特点,但因为不同厂商之间的系统具有极强的封闭性,互不兼容,导致成本高昂、难于管理、可扩展性不足、程序可移植性差等问题。
曙光推出的第二代小型机遵循通用型工业设计标准,并且结合多路SMP设计、支持双核CPU、集成系统内存控制器、多通道高速I/O设计、多部件冗余设计,继承了传统小型机的优点,也突破了传统小型机困扰用户多年的诸多不足。
跟传统小型机相比,曙光二代小型机除支持Solaris、Windows外,还支持众多的LINUX类操作系统,满足越来越广泛的LINUX应用需求;采用通用型产品设计,从硬件层、操作系统层和应用层大大降低管理难度,天演8路小型机EP850的管理难度仅同双路或四路PC服务器相当;由于支持广泛的X86应用,可以轻松实现目前90%的应用移植;遵循工业标准设计,使其维护和升级扩展非常方便,不再受单一硬件厂商发展的制约。
更重要的是,二代小型机的性价比非常高,其价格仅相当于同类传统小型机产品的30%-50%。并且从性能上看,二代小型机也基本接近传统小型机,这是因为X86芯片性能已经非常接近RISC芯片。目前X86芯片也是多路SMP设计、支持双核CPU、集成系统内存控制器、多通道高速I/O设计、多部件冗余设计,这些特点都与RISC芯片的架构基本相同。它们最大的不同可能在于RISC芯片使用精简指令集系统,X86芯片使用复杂指令集系统,但现在X86芯片也和RISC芯片一样使用短流水线,所以不论从哪方面看X86芯片的性能都已经非常接近RISC芯片。
1.2. 曙光二代小型机和传统小型机的主要应用领域
1.2.1. 传统小型机的主要应用领域
1)第一代小型机的应用领域
1)专有特殊领域:
在UNIX上开发的专用的应用,如金融、电信等,因其专用性,基本上不存在兼容性。
2)通用领域:
通用应用在小型机系统的应用,如:Oracle、Sybase、Websphere、Weblogic。以此构建的数据库系统,网络应用系统、终端服务系统。
3)用户自行开发的应用:
目前众多用户自主研发的应用运行在UNIX下,以实现在小型机的应用。
2)第一代小型机的局限性
1)管理难度大
每一种小型机自成体系,需要特殊的操作系统与应用程序,即使是通用应用,也因操作系统的专一性,导致通用应用在不同UNIX操作系统管理大相径庭。
2)可扩展性差
由于系统体系结构限制,其扩展性难以与PC Server相比。
3)程序可移植性差
小型机独有的体现结构,基本上不能实现异构系统的程序移 植,即使是不同时期的同一公司产品也很难实现程序移植。
4)价格昂贵,总体投资高
因其系统不开放性,使其市场价格居高不下,维护费用高。
1.2.2. 曙光二代小型机的主要应用领域
1)第二代小型机出现的背景
1)LINUX的广泛应用
LINUX操作系统已日趋成熟,其性能已经和UNIX操作系统相当。如:在UNIX下应用的Oracle、Sybase等企业级数据库系统已经在LINUX下成功应用,并且得到了时间与应用的检验。
2)基于X86架构的64位处理器系统性能的大幅度提高
X86架构下双核系统的成功推出及多路处理器计算机系统的成功研发,使得基于RISC架构下的传统小型机性能优势不复存在。
2)第二代小型机产品介绍
曙光天演EP420、EP430、EP480和EP850二代小型机采用了业内非常先进的铜互连技术的AMD 64位多核处理器,体系结构为SMP对称多处理,目前最多可支持八颗多核Opteron CPU,结合系统内存控制器、多通道存储子系统、优秀的机箱设计以及完美的冗余设计。
- CPU:最大支持8颗64位多核Opteron处理器,集成2MB二级缓存,CPU之间采用6.4GB/s高速传输总线连接。
- 内存:最大支持128GB内存寻址空间,内存总带宽最高可达51.2GB/s。
- 存储:采用单、双、多通道高速I/O设计,提供优异磁盘性能和高可靠数据保护机制,支持多种RAID类型。
- 操作系统支持:全面支持Windows、Linux和Solaris10 X86。
第二代小型机的优点
第二代小型机在第一代小型机的基础上,继承了第一代小型的优点并拓展的第一代小型机的应用而发展起来的高性能64位计算机。
1)继承了第一代小型机的优点
- 高运算处理能力----High Performance
整合多处理器系统,一般CPU系统规模在8-32之间,高速系统专用总线,高速专用内存总线,高速I/O存储通道。
下图是Oracle查询测试(单位为时间,数值越低越好)
下图是TPC-C 基准测试
- 高可靠性----Reliability
多部件冗余的实现----是第一代传统小型机的技术延续,冗余部件包括:电源系统、存储系统、散热系统。
- 高可用性----Availability
高标准的系统与部件设计------是第一代传统小型机的技术延续,支持UNIX类操作系统----支持SUN Solaris,支持LINUX类操作系统,Oracle、Sybase等应用的实现。
2)支持Linux类操作系统
第二代小型机在OS上对第一代小型机的拓展,目前RISC架构下的IBM Power5全面支持LINUX。
3)管理难度降低
采用通用型产品设计,第二代小型机管理无论是硬件层还是OS层、应用层的难度均较第一代小型机管理难度大幅降低。如:曙光推出的天演EP850第二代小型机的管理难度仅同2P或4P PC Server难度相当。
4)程序移植性增强
基于X86的应用的广泛应用,因此基于X86的第二代小型机可以轻松实现目前90%的应用的移植。目前曙光公司推出的EP850、EP480、EP430、EP420产品可以将用户近90%实现移植。
5)扩展性增强
采用通用标准设计,抛弃传统小型机依托的专用系统设计,使得第二代小型机可以轻松跟随服务器产品技术的发展,而不受限于单一硬件厂商发展的制约。
6)价格明显低于第一代小型机,性价比高
由于第二代小型机设计思想的改变,在吸收第一代小型机的优点同时,顺应时代的变化,在保证性能的同时使得其产品成本大幅下降,目前第二代小型机的价格相当于同类传统小型机的产品的30%-50%的市场价格。曙光EP850目前市场价格相当于同类第一代小型机价格的40%左右。
7)为构建小型机机群创造了良好条件
构建小型机机群是许多小型机用户的一个梦想,但第一代小型机高昂价格使得这种想法难于实现,采用第二代小型机,机群将经济上易于构建、管理上易于上手。
8)嵌入式H-IDS,更高的网络安全性
由于第二代小型机中嵌入了曙光自主研发的H-IDS主机型IDS软件,可以获得更好的网络安全性,为用户构建了无安全隐患的网络系统
4)曙光第二代小型机的应用领域
- 信息服务领域:性能、稳定性要求高的服务器
- 数据库应用领域:Oracle、Sybase等应用
- 科学计算系统:基因、气象、汽车、生物、石油、数学、船舶等
5)曙光第二代小型机应用案例
案例一:某公安局信息中心
- 实际配置-- 4个曙光天演EP850二代小型机构建集群,代替原有传统小型机解决方案
- 应用范围-- 大规模数据库应用
- 软件支持-- Redhat AS3.0、Oracle RAC
案例二:网游项目
- 三十多台曙光64位服务器EP430来部署《天堂II》在全国的网游平台
- 高带宽,可容纳5000人同时在线
- 一般二路至强服务器的并发用户数只能达到一千人左右
- 单台服务器能够容纳5000人同时在线
- 号称“永不掉线”的服务器
- EP430具有良好的平滑升级能力、可扩展性和高可用性
- 完全满足对稳定性、可靠性、处理性能的苛刻要求,是一款强大的适用于后台数据处理的企业级服务器
2. 基于曙光二代小型机的oracle数据库解决方案
2.1. Oracle数据库单机系统解决方案
Oracle数据库单机系统主要是针对一些小规模数据库应用,或是用户的经费不太宽裕,又或是用户的数据库系统对安全性和冗余度要求不太高并且负载也不太重的情况。这个系统仅需要一台服务器和一个存储设备,服务器和存储可以进行直连,在其上安装Oracle数据库的单机版本就可以了。
这里特别要注意的是EP850(八路双核)二代小型机,在windows的操作系统版本中只有windows2003或者windows2000的数据中心版才能支持16颗CPU(也就是八路双核),windows2003或者windows2000的企业版最多可以支持到8颗CPU。Linux目前要支持到16颗CPU 的只有Redhat Linux和SUSE Linux,而Redhat Linux需要升级内核到2.6.11.12,SUSE linux也需要升级内核到2.6.11.12。Unix系统只有Solaris10 update1可以支持16颗CPU。
Oracle10g
Oracle9i
2.2. Oracle数据库双机高可用系统解决方案
Oracle数据库双机高可用系统主要是针对用户的数据库系统比较关键,对安全性和冗余度要求很高,但其负载不算太重的情况,一台服务器的性能基本可以支撑的情况。这个系统需要两台服务器和一个存储设备,服务器和存储可以进行直连,也可以都连在光纤交换机上,同时两台服务器需要通过网络交换机进行通信,另外它们之间还需连接心跳线,心跳线一般由一根直连的网线和一根RS232的串口线组成。在其上除了要安装Oracle数据库的单机版本以外,还需要安装双机高可用软件,在本方案中我们推荐ROSE HA双机软件。
ROSE HA是美国ROSE Datasystem Inc.出品的新一代高可用性软件,它可以将服务器组成集群系统,并对服务器进行监控、故障检测、故障恢复,保护运行于服务器中的关键性数据服务和网络服务。对于在客户机/服务器环境中的网络及数据库中集成的高可用需求,ROSE HA 提供了非常灵活而且适用的解决方案。由于ROSE HA双机软件在我们公司已经有了多个成功案例,是一款非常成熟的软件产品,因此我们建议使用它来做我们的Oracle数据库双机高可用系统中的双机软件。
Oracle10g
Oracle9i
2.3. Oracle数据库多机集群系统解决方案
Oracle数据库多机集群系统主要是针对用户的数据库系统规模比较大,应用非常关键,对安全性和冗余度要求非常高,并且相应的其负载也相当重的情况,所以它需要多台服务器来支撑,对这多台服务器做负载均衡,所有服务器形成一个集群对外提供统一的服务,并且可以实现高可用,其中某一台服务器出现问题不会影响整个集群,对整个应用也没有太大的影响。
这个系统需要多台服务器和一个或多个存储设备,服务器和存储都连在光纤交换机上,同时所有服务器需要通过网络交换机进行通信,并且建议用一台千兆交换机做私网通信,用一台千兆交换机或者百兆交换机(看具体网络负载来决定)做公网提供对外通信。
Oracle10g RAC
Oracle9i RAC
|
3. Oracle10g RAC数据库简介
oracle10g RAC结构
下图显示了 Oracle RAC 10g 配置的主要组件。 集群中的节点通常是单独的服务器(主机)。
硬件
在硬件级别上,RAC 集群中的各节点共享三种功能:
1. 对共享磁盘存储的访问
2. 与专用网络的连接
3. 对公共网络的访问。
共享磁盘存储
Oracle RAC 依赖于一个共享磁盘体系结构。 数据库文件、联机重做日志和数据库的控制文件必须都能为集群中的每个节点所访问。 共享磁盘还存储 Oracle Cluster Registry 和 Voting Disk(稍后讨论)。 配置共享存储有多种方法,包括直接连接磁盘(通常是使用铜缆或光纤的 SCSI)、存储区域网 (SAN) 和网络连接存储 (NAS)。
专用网络
每个集群节点通过专用高速网络连接到所有其他节点,这种专用高速网络也称为集群互联或高速互联 (HSI)。 Oracle 的 Cache Fusion 技术使用这种网络将每个主机的物理内存 (RAM) 有效地组合成一个高速缓存。 Oracle Cache Fusion 通过在专用网络上传输某个 Oracle 实例高速缓存中存储的数据允许其他任何实例访问这些数据。 它还通过在集群节点中传输锁定和其他同步信息保持数据完整性和高速缓存一致性。
专用网络通常是用千兆以太网构建的,但是对于高容量的环境,很多厂商提供了专门为 Oracle RAC 设计的低延迟、高带宽的专有解决方案。 Linux 还提供一种将多个物理 NIC 绑定为一个虚拟 NIC 的方法(此处不涉及)来增加带宽和提高可用性。
公共网络
为维持高可用性,为每个集群节点分配了一个虚拟 IP 地址 (VIP)。 如果主机发生故障,则可以将故障节点的 IP 地址重新分配给一个可用节点,从而允许应用程序通过相同的 IP 地址继续访问数据库。
Oracle 集群就绪服务
Oracle RAC 10g 引进了 Oracle 集群就绪服务 (CRS) — 一组用于集群环境的与平台无关的系统服务。 在 RAC 和 Oracle 并行服务器先前版本中,Oracle 依靠厂商提供的集群管理软件来提供这些服务。 虽然 CRS 与厂商供应的集群件协同工作,但 Oracle RAC 10g 所需组件只是 CRS。 实际上,必须在安装 RAC 之前安装 CRS。
CRS 维护着两个文件: Oracle Cluster Registry (OCR) 和 Voting Disk。 OCR 和 Voting Disk 必须以原始分区或集群文件系统文件的形式存在于共享磁盘上。
Oracle RAC 软件
Oracle RAC 10g 软件是 RAC 数据库的核心,每个集群节点上都必须安装。 幸运的是,Oracle Universal Installer (OUI) 可以完成在每个节点上安装 RAC 软件的大部分工作。 您只需在一个节点上安装 RAC — OUI 会完成其余的工作。
Oracle 自动存储管理 (ASM)
ASM 是 Oracle 数据库 10g 中的一个新特性,它以一种与平台无关的方式提供文件系统服务、逻辑容量管理器和软件 RAID。Oracle ASM 可以条带化和镜像磁盘,从而实现了在数据库被加载的情况下添加或移除磁盘以及自动平衡 I/O 以删除“热点”。它还支持直接和异步的 I/O,并使用 Oracle9i 中引入的 Oracle 数据管理器 API(简化的 I/O 系统调用接口)。
Oracle ASM 不是通用的文件系统,只能用于 Oracle 数据文件、重做日志、控制文件和 RMAN 快速恢复区。ASM 中的文件既可以由数据库自动创建和命名(使用 Oracle 管理文件特性),也可以由 DBA 手动创建和命名。由于操作系统无法访问 ASM 中存储的文件,因此对使用 ASM 文件的数据库执行备份和恢复操作的唯一途径就是使用恢复管理器 (RMAN)。
ASM 作为单独的 Oracle 实例实施,只有它在运行时其他数据库才能访问它。ASM 需要的内存不多: 对大部分系统来说只需 64MB。 在 Oracle RAC 环境中,ASM 实例必须运行在每个集群节点上。