服务器 频道

系列文章:服务器常见故障分析解决(一)

    【IT168 技术】在服务器配置应用中,常常会遇到各种各样的问题,有时候一个小小的问题可能让你手忙脚乱,本文旨在为用户提供一些实战中的技巧,希望在应用中真的能帮到那些需要的人。

        一、服务器无法启动 

        原因分析: 

        市电或电源线故障(断电或接触不良)

  电源或电源模块故障

  内存故障(一般伴有报警声)

  CPU故障(一般也会有报警声)

  主板故障

  其它插卡造成中断冲突

  解决办法:

  检查电源线和各种I/O接线是否连接正常。

  检查连接电源线后,主板是否加电。

  将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。

  检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。

  如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板)

  二、系统频繁重启

  原因分析(解决办法)

  电源故障(替换法判断解决)

  内存故障(可从BIOS错误报告中查出)

  网络端口数据流量过大(工作压力过大)

  软件故障(更新或重装操作系统解决)

  三、服务器死机

  原因分析及解决办法:服务器死机故障比较难以判断,一般分为软件和硬件两个方面:

  软件故障

  首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。

  电脑病毒的原因

  系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。

  软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决

  硬件故障

  硬件冲突

  电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。

  硬盘故障(通过扫描硬盘表面来检查是否有坏道)

  内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断)

  主板故障(使用替换法来判断)

  CPU故障(使用替换法)

  板卡故障(一般是SCSI/RAID卡或其他PCI设备也有可能造成系统死机,可用替换法判断处理)

  注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。

0
相关文章