IBM P系列小型机日常维护故障定位故障排除

2020-02-21 18:14

IBM P系列小型机日常维护/故障定位/故障排除

第一章、机房环境及物理检查

一、机房内环境要求 1. 温度与湿度: 最佳工作温度:20-25摄氏度 极限工作温度:10-40摄氏度 湿度: 8-80%(在23摄氏度条件下) 如果不是工作在最佳温度,请注意改善机房环境

2. 同时机房要保证清洁.

机房应保持清洁,若空气灰尘过多,很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁

损。 二、电源要求

电 压: 要求电压稳定, 尖峰电压会损坏设备

电压范围: 220V +/- 10%, 即200-240V, 50-60Hz

电源功率: 视机器类型和系统配置而定

电源线 : 标准的零, 地, 火三相电, 其中零, 地电压不得超过3.0V.

电源接驳: 用符合电流要求的空气开关或其他设备和主机电源线接驳,保证计算机系统的可靠工作应使用稳压电源和UPS,并建议配备发电机组;对于冗于电源的接入,建议采用两路

单独输入.

三、硬件检查

检查服务器、磁阵的安装、电源线、7133和主机接线符合要求。

服务器状态检查:

1. 当服务器处于启动和正常工作状态时,其前面板上的液晶显示屏上应无信息显示。 2. 当液晶显示器上出现带数字和字母的信息时,说明有硬件告警。可以通过查询相关机型的Service Guide查到相应告警原因,情况严重的,则要立即通知IBM技术专家进行问题

排查。

7133状态检查:

磁阵前面板上有7133机柜的状态灯(与电源灯并排)和各硬盘的状态灯(一排小灯,与各

硬盘位置一一对应)。

1. 当机柜的状态灯出现橙黄色时,说明有硬件告警,此时要检查磁柜的电源、接线、硬盘等。如果有硬件故障则立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进

一步诊断。

2. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时或SSA环路出现问题时,则硬盘状态

灯将熄灭,或者呈闪烁状态:以1~3秒的频率有规律地、不停地闪烁

第二章、系统日常维护流程

2.1系统启动 系统启动正常顺序如下:

首先对外设(磁盘阵列、磁带库等)加电。

待所有外设加电自检完成后, 主机加电正常起机。主机加电后,系统进行自检,在液晶显示

屏显示”ok”后,才能按白色POWER键起机.

启动主机HACMP,启动后可用命令 tail -f /tmp/hacmp.out 来检查启动情况,在HACMP未

完全启动前不要进行下一步。

检查服务器的网络地址,路由表(可用netstat -i , netstat -rn 等),检查文件系统,逻

辑卷(可用 mount , lsvg -o 等)。

检查各项应用是否工作正常。

2.2系统关闭

停止HACMP ( smitty clstop)。

查看HACMP的状态,检查服务器的网络地址,路由表(可用netstat -i , netstat -rn 等),检查文件系统,逻辑卷(可用 mount , lsvg -o 等)。在HACMP未完全停止前不要进行下一

步。

关闭主机 (shutdown –F)。重启系统可以使用:shutdown -Fr

如有必要的话,按磁盘阵列前方的白色按钮关闭磁盘阵列。

2.3查看系统的错误记录

在系统运行时,一些系统错误会记录在errlog 中,其中有些错误还会在终端上显示。检查

错误日志可用以下命令:

#errpt|more 查看系统所有的记录

IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTION

E85C5C4C 0426104399 P S CFGLFT SOFTWARE PROGRAM ERROR

2BFA76F6 0426104099 T S SYSPROC SYSTEM SHUTDOWN BY USER

9D4CF6E7 0426104399 T O errdemon ERROR LOGGING TURNED ON

1E2AC07E 0426103999 T O errdemon ERROR LOGGING TURNED OFF

1E5EER4T 0423132999 T O clstrmgr OPERATOR NOTIFICATION

其中

IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。

TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年

T 为Type , 它记录的是错误类型

P :为永久错误,需引起注意

T :为临时错误。

C 为Class, 它记录的是错误种类,如

H : Hardware

S : Software

O : Errloger command messages

U : undetermined

RESOURCE_NAME 为错误来源

DESCRIPTION 为错误描述

#errpt -aj 查看系统详细记录内容

其中IDENTIFIER为错误编号,如 #errpt -aj 0426104399

#errpt -dH 查看系统所有的硬件出错记录

2.4系统与数据备份

有效及时的系统备份是系统管理的非常重要的一环。当系统出现故障时,特别是文件系统被严重损坏或硬盘损坏时,常需要使用系统备份来恢复系统。在以下情况下应做系统备份:

1、新装机。在硬件及系统软件安装完成后,应做系统备份。

2、软件改动。系统软件或应用软件有改动时,应做系统备份。

3、定期备份。对系统进行定期备份,最好每两或三个月做一次备份


IBM P系列小型机日常维护故障定位故障排除.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:崇文区2008年高三第二次模拟考试数学文科

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: