服务器 频道

以数据库为核心 x86处理器选型三大考虑

  2) 保证可靠性是x86处理器的必修课

  但是另一个摆在我们面前的问题是处理器的可靠性问题。众所周之,企业中的数据库作为支撑前台业务的核心,其可靠性要保证在99.9%以上。而与RISC平台相比,x86处理器由于计算原理所限,在计算可靠性和精确性上有天然缺陷。也因此,关键业务领域一直以来都选用的是RISC平台,而x86平台被看做是不稳定、不可靠的通用计算平台。

  在数据库规模日趋庞大的今天,很多企业在犹豫是保有原来的x86平台数据库,承担可能的风险;还是迁移到RISC小型机上,承担一大笔成本。实际上,这类矛盾和担忧一直存在于关键业务领域在x86平台和RISC平台的博弈中。甚至有DBA在采访中称:“性能高、稳定性又能与小型机媲美,我当然会选择相对灵活的x86平台,因为成本要少很多。”

  可见,x86平台的开源和低成本是吸引数据库用户部署的主要因素。另一方面,x86处理器在说服数据库用户时,迫切需要提高的就是可靠性。

  传统上来说,RISC+UNIX比x86+Linux或Windows更稳定。RISC服务器在硬件架构设计上与X86服务器有很大的差别,使用了非常多的冗余技术和高可用技术,因此可靠性较高,当然成本也更高。X86服务器的硬件质量水平参差不齐,有高有低,硬件做工上稍差。不过,X86服务器——尤其是X86处理器与RISC处理器的可靠性比拼上,也在不断进步。

  在至强7500的正式说明文档中,提到的RAS特性就有22条之多,集中解决三个方面的问题:一是数据保护,利用CRC、ECC等硬件机制来对传输的数据进行校验、纠错,如果无法纠正,就将损坏的数据进行隔离,以保证不造成更大的数据,避免系统的重启和宕机。

  二是高可用性,包括各种主要部件的备、镜像和热切换等,以保证系统的高可用性。

  三是计划宕机时间最小化,包括系统分区管理技术、CPU和内存的热添加和热移除等,将系统维护时间降低到最小。

  这些特性形成了一个完整的MCA架构(Machine Check Architecture),可以在不关机的情况下检查和纠正处理器、内存或者IO中的错误,在OS配合的情况可以对系统进行热维护,保障系统的不间断运行。据了解,原先只在IA64架构处理器上才有MCA功能;而系统方面,包括微软Windows Server、RedHat、SUSELinux以及VMware等平台都已经支持这一功能。

0
相关文章