较高级别的内存保障——内存镜像和内存热备
有数据显示,在所有的因为硬件故障导致的宕机事件中,内存故障的概率最高,而且随着内存容量越来越大,出错可能性更高了,传统的ECC保护已无法满足高数据可靠性的需求。为了确保产品的“国际品质”,浪潮工程师在NF280上采用了业内领先的内存容错技术——内存热备和内存镜像技术(两种技术原理不同,用户可以根据自己的需求进行选择)。
采用内存热备时,做热备份的内存在正常情况下是不使用的,每个内存通道中有一个DIMM通道不被使用,预留为热备内存。芯片组中设置有内存校验错误次数的阈值,即每单位时间发生错误的次数——“容错阈值”,当工作内存的故障次数达到“容错阈值”,系统将主内存数据写入热备内存,当系统检测到两个内存数据一致后,热备内存就代替主内存工作,故障内存被禁用,这样就完成了热备内存接替故障内存工作的任务,有效避免了系统由于内存故障而导致数据丢失或系统当机。当然,做热备的内存容量应大于等于所在通道的最大内存条的容量,以满足内存数据迁移的最大容量需求。
![]() |
| 内存热备示意图 |
使用内存镜像技术时,内存数据有两个拷贝——主内存和镜像内存,两者容量相同。系统工作时会向两个内存中同时写入数据,因此内存数据有两套完整的备份。由于为通道间交叉镜像的方式,每个通道有一套完整的内存数据拷贝。一旦主内存出现故障,镜像内存将替代主内存工作,有效避免了由于内存故障而导致数据丢失。
![]() |
| 内存镜像技术示意图 |
