IBM PC服务器故障诊流程(2)

2019-03-11 09:05

查询手册:Hardware Maintenance Manual and Troubleshooting Guide? Chapter 4. Customer replaceable units ? System-board LED locations

(3). 确认机器报警声信息。

查询手册:Hardware Maintenance Manual and Troubleshooting Guide? Chapter 6.

Symptom-to-FRU index? Beep symptoms (4). 最小化测试 4、 狭义POST阶段:

在显示器开始有显示之后,进入我们所谓的狭义POST阶段,在这个阶段,我们开始告别两眼一抹黑的困境;

首先,CPU的基本功能初始化完成,他可以执行POST代码对部件进行全面的自检,并且,显卡POST功能的通过,我们又有了可供CPU反馈POST结果的平台,报错码、诊断工具纷呈出台;

所以,在这个阶段,最核心的思想就是:掌握好设备的报错码分析手段和诊断工具的使用; IBM:

(1).指示灯法:

和核心部件阶段的方法一样;

(2).报错码:

Hardware Maintenance Manual and Troubleshooting Guide? Chapter 6. Symptom-to-FRU index? Error symptoms和POST error codes; (3).F2诊断程序,自检阶段根据提示F2 for DIAGNOSTICS,可以根据提示选择Quick test,测试硬件设备,查看测试日志;

①开启服务器并观察屏幕。

注意:为了运行检测程序,必须使用所设置过的最高级别的密码启动。就是说,如果设置了管理员密码和开机加电密码,则用户要运行检测程序就必须输入管理员密码,而不是开机加电的密码。

②当看到F2的检测程序信息出现时,按F2进入。 ③如果设置了密码,输入正确的密码然后按回车。

④在屏幕最顶端的菜单中选择\或\来执行两种检测模式。

⑤当检测程序菜单界面出现的时候,从中选择你想运行的检测项目,然后按照屏幕上的提示操作。

a、用户可以在运行检测程序的时候按F1获得帮助信息,并且用户还可以在帮助窗口内按F1来获得在线的文档帮助,从中用户可以选择不同类别的信 息。要从帮助信息中退出,按ESC。

b、如果服务器在检测过程中停止并且用户不能继续执行检测程序,重新启动服务器并且尝试再次运行检测程序,如果检测这个设备依旧出现服务器停止的问题,更换这个部件。

c、键盘和鼠标(点击设备)的检测假定有一个键盘和鼠标已经连接到服务器上。 d、如果用户在没有连接键盘或鼠标的情况下运行检测程序,那么将无法使用\Cat\和\Cat\按键来操作在不同类别的检测项目之间进行切换。所有其它的功能选项均提供鼠标可点击的按钮,并且也支持使用功能键。

e、用户可以使用常规的键盘检测项目来检测USB的键盘,而常规的鼠标检测也可用来检测USB鼠标。当没有USB设备连接的时候,用户还可以使用USB接口的检测只检测端口。

f、用户可以通过选择顶端的\选项来查看服务器的配置信息(如系统的配置、内存容量、中断请求(IRQ)的使用、直接内存存取(DMA)的使用及设备驱动等等)。 如果检测程序没有检测出任何硬件错误,但是在系统正常运行过程中依旧出现问题,那么有可能是软件错误导致的。如果用户怀疑是软件问题,可以查看通过软件补丁生成的信息。

查看检测日志:当检测完成后,用户可以用过选择屏幕顶端的\项目,然后选择\Test Log\来查看检测日志。用户也可以将检测日志生成一个文件并保存到软盘或硬盘上。

测试结果:

我们常常关注的是Failed和Warning这两项。 (4).F1 for Setup,自检阶段根据提示F1 for Setup?Event/Error log查看分析和清除系统错误日志,以及进入高级设置Advanced Setup清除BMC日志;

5、 操作系统无法启动:

系统无法启动,IBM服务器如果外加的阵列卡IBM ServeRAID 当中的RAID信息丢失,系统会找不到引导盘,从而进入不了操作系统,这种情况的表象是在RAID卡BIOS阶段有报错,在进入操作系统会出现画面:一个图形界面,最下面是标注了F1至F12的一堆方块,其中,F1上面有一个向下的箭头在闪动;这个是没有找到启动设备的告警;提示你按下F1继续;按下F1之后,发现设备告警:没有找到启动设备,因为IBM外加阵列卡的服务器的RAID信息在硬盘和阵列卡上都有保存,可以借助RAID卡BIOS,将RAID信息从硬盘拷贝到RAID。具体做法是,当设备自检到RAID卡时,根据提示,进入“Mini-Configuration(RAID卡BIOS)”,选择Advanced Functions? Copy the Configuration from Drives to Controller,将配置从硬盘拷贝到控制器?提示按Y,按Y?提示processing,表示正在拷贝?出现0000H,表示成功,之后操作系统会提示重新启动,重新启动之后,成功进入操作系统。

对于非设备硬件的问题,而是丢了一些系统内核文件导致,需要的是修复操作系统,比如重新安装操作系统。

6、 操作系统中的在线诊断工具:

在操作系统运行的时候,各个厂商也提供了自己的在线诊断工具: IBM: (1).DSA:

DSA软件不仅可以收集信息,也可以判断故障; (2).ServeRAID Manager:

专门用来管理阵列信息; (3).director:

如果有集中监控和管理平台,可以使用这个软件判断故障; 7、 故障解决方法: IBM:

Eg: Hardware Maintenance Manual and Troubleshooting Guide - IBM eServer xSeries

346 .pdf? Chapter 4. Customer replaceable units和Chapter 5. Field replaceable units

8 / 8


IBM PC服务器故障诊流程(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:弹性力学简明教程(第四版) - 课后习题解答

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: