服务器常见的十四个故障及分析
一、造成服务器无法启动的主要原因 : 市电或电源线故障(断电或接触不良)
电源或电源模组故障
内存故障(一般伴有报警声)
CPU故障(一般也会有报警声)
主板故障
其它插卡造成中断冲突
二、服务器无法启动 ?
检查电源线和各种I/O接线是否连接正常。
检查连接电源线后主板是否加电。
将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。
检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。
如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板)
三、系统频繁重启 ?
造成系统频繁重启的原因:
电源故障(替换法判断解决)
内存故障(可从BIOS错误报告中查出)
网络端口数据流量过大(工作压力过大)
软件故障(更新或重装操作系统解决)
四、服务器死机故障判断处理:
服务器死机故障比较难以判断,一般分为软件和硬件两个方面:
软件故障
硬件故障
软件故障
首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。
电脑病毒的原因。
系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。
软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决
硬件故障
硬件冲突
电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。
硬盘故障(通过扫描硬盘表面来检查是否有坏道)
内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断)
主板故障(使用替换法来判断)
CPU故障(使用替换法)
板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)
注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。
五、安装操作系统时提示找不到硬盘?
故障原因:
无物理硬盘设备
硬盘线缆连接问题
没有安装硬盘控制器驱动或驱动不相符
六、如何获得驱动程序?
使用随机光盘制作相应驱动
七、为什么用正确的驱动仍然无法加载硬盘控制器驱动?
查看是否启用了hostraid功能。
八、新购买的一块硬盘,安装到机器上之后,机器自检无法通过?
将新的硬盘取下,机器是否可以自检通过;
检查新增加的硬盘的ID号是否与原来的硬盘的ID号相同,如果硬盘的ID号相同的话,自检将无法通过。
九、如何格式化SCSI硬盘?
有操作系统的情况:使用磁盘管理工具格式化;
无操作系统的情况:在SCSI管理控制界面格式化;
以ADAPTEC Raid卡为例:开机-出现CTRL+A 信息时,按CTRL+A进 入-选中通道A
-选中SCSI UTILITY-将检测到硬盘-选中要检测的硬盘
-选中FORMAT可对硬盘进行全面格式化
选中VERIFY可对硬盘进行检测,检查是否有坏道
注意:在格式化硬盘时不能中断或停电,不然会损坏磁盘
十、在Aisino 系列中有RAID卡机器,当其中一个硬盘不能正常工作RAID报警,但系统能正常运行,怎么办?
用一个新硬盘,确保容量大于或等于不能正常工作的硬盘,最好用相同型号的硬盘替换即可。
RAID卡相关常见故障
第一类: RAID卡本身有问题