IBM P系列小型机日常维护故障定位故障排除(5)

2020-02-21 18:14

问题表现:

对ssa卡上的电池保护是通过卡上的一个计数器实现的,每运行一小时该计数器会增加一,当该计数接近或超过22000时,系统会有

26CA120B硬件报警:

26CA120B 0206120904 P H ssa1 CACHE STORAGE CARD

可以用如下命令检查ssa卡上的状态:(-a 后带上卡的逻辑设备

名,这里假设是ssa0)

ssa_fw_status -a ssa0 -p (检查电池已经工作的时间,小

时为单位)

ssa_fw_status -a ssa0 -l (检查电池安全工作寿命,小时

为单位)

ssa_fw_status -a ssa0 -c (检查ssa卡上的fast write

功能是否被激活)

处理步骤: (按优选方式列出,从中选择一种即可)

1)更换电池

选择系统闲时,更换主备机ssa卡电池,可以采用:

停备机-》更换备机ssa卡电池-》起备机(双机服务)-》主备

倒换-》

停原主机-》更换原主机ssa卡电池-》起原主机(双机服务)

2)如果系统出现26CA120B电池告警,使用ssa_fw_status -a ssa0 -c 检查主用ssa卡(一般是ssa0)的Fast Write是否处于inactive(未

被激活)状态,如果是,则以root执行如下命令:

ssa_format -l ssa0 -b

errclear 0

/usr/lib/errstop

/usr/lib/errdemon

可以暂缓更换电池时间,等有电池后再更换,但这段时间对磁阵读

写性能会有所影响。

3)如果短期内不能更换电池,同时主机主用卡的Fast Write仍然处于

Active状态,建议手工屏蔽fast write功能

1)先停止双机

2)在1号机修改hdisk该属性:

smitty dev->ssa disks->ssa logical disks->change /show characters of ... -> [choose hdisk2] -> fast write [no]

3)在1号机激活卷组

varyonvg zxinvg

4)在1号机去激活卷组

varyoffvg zxinvg

5)在2号机上执行

smitty dev->ssa disks->ssa logical disks->change /show characters of ... -> [choose hdisk2] -> fast write [no]

检查fast write是否已经改为no (只要1号机做了2好机就

不用再修改了)

6)在2号机上执行

rmdev -dl hdisk2

cfgmgr -v

7)在2号机上执行

lspv (查看hdisk2是否已找到)

8)然后执行

varyonvg zxinvg

varyoffvg zxinvg

9)重新启动双机

对于出现错误:

B4C00618 0115140004 P H ssa0 RESOURCE UNAVAILABLE

而不伴随其他红色标出错误的情况,则通过以下方式排查:

可能是hdisk中将‘enable user of hot spare’打开了,而实际并

没有配置hot spare盘,

可以通过如下方式解决:

检查RAID的状态:

#smitty

ssaraid

list all defined SSA RAID arrays : all are in status good

(ssa0 )

检查是否配置了hot spare:

list/identify SSA Physical disks-->List hot spares : none

修改每个ssa卡所配置的hdisk的属性:

: set \

然后再执行:

# /usr/lib/errstop

# cp /var/adm/ras/errlog /var/adm/ras/errlog.bak

#/usr/lib/errdemon

#errclear 0

对于物理硬盘的接法可参考如下说明:(有可能老局未配置hot spare,

则连线方法按未配置hot spare盘的个数计算)

分以下几种情况讲述:

1) 数据盘小于等于6块,建议配置一块hotspare

2) 数据盘大于等于8块小于等于10块,建议配置两块hotspare

3) 数据盘大于等于12块小于等于14块,建议配置两块hotspare

l 数据盘小于等于6块,配置一块hotspare的接线和配置规则:

a) 主机A1、A2接磁阵1、8位置;备机A1、A2接磁阵4、5位置

b) 保证磁阵前排1\\4\\5\\8硬盘位置一定要插盘,其余的盘可以挑空位插,注意1-4、5-8两侧的数据盘保持轴对称关系插入(如1和8

是轴对称的、4和5是轴对称的)

c) 没有插硬盘的位置一定要插上dummy盘

d) 做RAID0+1时,考虑到性能问题,请将1-4、5-8以轴对称方式

一一对应做硬盘镜像,举例如下:

ibm对pdisk的排序与实际的物理位置是不同的,所以必须先通过lsdev -C |grep pdisk的方式找出其对应关系并记录下来,如:

pdisk0 Available 11-08-1641-01-P SSA160 Physical Disk

Drive

pdisk1 Available 11-08-1641-05-P SSA160 Physical Disk

Drive

pdisk2 Available 11-08-1641-04-P SSA160 Physical Disk

Drive


IBM P系列小型机日常维护故障定位故障排除(5).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:崇文区2008年高三第二次模拟考试数学文科

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: