问题表现:
对ssa卡上的电池保护是通过卡上的一个计数器实现的,每运行一小时该计数器会增加一,当该计数接近或超过22000时,系统会有
26CA120B硬件报警:
26CA120B 0206120904 P H ssa1 CACHE STORAGE CARD
可以用如下命令检查ssa卡上的状态:(-a 后带上卡的逻辑设备
名,这里假设是ssa0)
ssa_fw_status -a ssa0 -p (检查电池已经工作的时间,小
时为单位)
ssa_fw_status -a ssa0 -l (检查电池安全工作寿命,小时
为单位)
ssa_fw_status -a ssa0 -c (检查ssa卡上的fast write
功能是否被激活)
处理步骤: (按优选方式列出,从中选择一种即可)
1)更换电池
选择系统闲时,更换主备机ssa卡电池,可以采用:
停备机-》更换备机ssa卡电池-》起备机(双机服务)-》主备
倒换-》
停原主机-》更换原主机ssa卡电池-》起原主机(双机服务)
2)如果系统出现26CA120B电池告警,使用ssa_fw_status -a ssa0 -c 检查主用ssa卡(一般是ssa0)的Fast Write是否处于inactive(未
被激活)状态,如果是,则以root执行如下命令:
ssa_format -l ssa0 -b
errclear 0
/usr/lib/errstop
/usr/lib/errdemon
可以暂缓更换电池时间,等有电池后再更换,但这段时间对磁阵读
写性能会有所影响。
3)如果短期内不能更换电池,同时主机主用卡的Fast Write仍然处于
Active状态,建议手工屏蔽fast write功能
1)先停止双机
2)在1号机修改hdisk该属性:
smitty dev->ssa disks->ssa logical disks->change /show characters of ... -> [choose hdisk2] -> fast write [no]
3)在1号机激活卷组
varyonvg zxinvg
4)在1号机去激活卷组
varyoffvg zxinvg
5)在2号机上执行
smitty dev->ssa disks->ssa logical disks->change /show characters of ... -> [choose hdisk2] -> fast write [no]
检查fast write是否已经改为no (只要1号机做了2好机就
不用再修改了)
6)在2号机上执行
rmdev -dl hdisk2
cfgmgr -v
7)在2号机上执行
lspv (查看hdisk2是否已找到)
8)然后执行
varyonvg zxinvg
varyoffvg zxinvg
9)重新启动双机
对于出现错误:
B4C00618 0115140004 P H ssa0 RESOURCE UNAVAILABLE
而不伴随其他红色标出错误的情况,则通过以下方式排查:
可能是hdisk中将‘enable user of hot spare’打开了,而实际并
没有配置hot spare盘,
可以通过如下方式解决:
检查RAID的状态:
#smitty
ssaraid
list all defined SSA RAID arrays : all are in status good
(ssa0 )
检查是否配置了hot spare:
list/identify SSA Physical disks-->List hot spares : none
修改每个ssa卡所配置的hdisk的属性:
: set \
然后再执行:
# /usr/lib/errstop
# cp /var/adm/ras/errlog /var/adm/ras/errlog.bak
#/usr/lib/errdemon
#errclear 0
对于物理硬盘的接法可参考如下说明:(有可能老局未配置hot spare,
则连线方法按未配置hot spare盘的个数计算)
分以下几种情况讲述:
1) 数据盘小于等于6块,建议配置一块hotspare
2) 数据盘大于等于8块小于等于10块,建议配置两块hotspare
3) 数据盘大于等于12块小于等于14块,建议配置两块hotspare
l 数据盘小于等于6块,配置一块hotspare的接线和配置规则:
a) 主机A1、A2接磁阵1、8位置;备机A1、A2接磁阵4、5位置
b) 保证磁阵前排1\\4\\5\\8硬盘位置一定要插盘,其余的盘可以挑空位插,注意1-4、5-8两侧的数据盘保持轴对称关系插入(如1和8
是轴对称的、4和5是轴对称的)
c) 没有插硬盘的位置一定要插上dummy盘
d) 做RAID0+1时,考虑到性能问题,请将1-4、5-8以轴对称方式
一一对应做硬盘镜像,举例如下:
ibm对pdisk的排序与实际的物理位置是不同的,所以必须先通过lsdev -C |grep pdisk的方式找出其对应关系并记录下来,如:
pdisk0 Available 11-08-1641-01-P SSA160 Physical Disk
Drive
pdisk1 Available 11-08-1641-05-P SSA160 Physical Disk
Drive
pdisk2 Available 11-08-1641-04-P SSA160 Physical Disk
Drive