山西移动
HPRX6600SAS盘更换
操作文档
北京中亦安图科技股份有限公司
2012年10月30日
说明
对于安腾主机rx2660, rx3600, rx6600, BL860c, BL870c,在安装HPUX操作系统的情况下,通常使用的都是HP 8 Internal Port SAS Controller 连接SAS硬盘,且HP 8 Internal Port SAS Controller只提供对硬盘RAID1配置。HPUX操作系统识别到的是通过SAS Controller划分后的’Lun’,而非真正的物理硬盘。
1.设备信息
HostName: sxyy7
Model: ia64 hp server rx6600
HP OS: HP-UX sxyy7 B.11.23 U ia64 1585715249 unlimited-user license
1. 查看指示灯状态
位于1号盘柜上,槽位为5处的硬盘状态指示灯为amber闪烁状态:
以下是硬盘Status LED和Activity LED状态说明 Activity LED Off Solid green Flickering green Off Solid green Status LED Off Off Off
SAS Disk Drive State Offline or not configured Normal operation; no activity Normal operation; disk read or write activity Flashing amber at Offline, no activity; predictive failure 1 Hz Flashing amber at Online, no activity; predictive failure 1 Hz Disk activity; predictive failure Flashing amber at (这种状态有时我们在sasmgr里可能看到State 为Online,条件允许的话还是需要换1 Hz 掉) Solid amber Solid blue Offline; no activity; critical fault Offline; drive selected by locator function Drive rebuilding Flickering green Off Off Flashing green at 1 Off Hz 2. # dmesg命令查看
执行#dmesg后发现输出内有如下信息:
SAS driver at 0/4/1/0 (/dev/sasd0) : RAID volume at SAS address 0x033a056ea2c1584e is in a degraded state.
SAS driver at 0/4/1/0 (/dev/sasd0) : RAID volume at SAS address 0x033a056ea2c1584e is in a degraded state.
3. 确认 SAS Contoller使用的设备文件
sxyy7#[/]/usr/sbin/ioscan -kfnd sasd
Class I H/W Path Driver S/W State H/W Type Description
==================================================================== escsi_ctlr 0 0/4/1/0 sasd CLAIMED INTERFACE HP PCI/PCI-X SAS MPT Adapter
/dev/sasd0
4. 查看RAID级别以及物理盘和逻辑盘对应关系
sxyy7#[/]sasmgr get_info -D /dev/sasd0 -q raid
---------- LOGICAL DRIVE 7 ----------
Raid Level : RAID 1
Volume sas address : 0x33a056ea2c1584e Device Special File : /dev/rdsk/c3t0d0
Raid State : DEGRADED Raid Status Flag : ENABLED Raid Size : 139236 Rebuild Rate : 0.00 % Rebuild Progress : 100.00 %
Participating Physical Drive(s) :
SAS Address Enc Bay Size(MB) Type State
0x500000e116da8ec2 1 6 140014 PRIMARY ONLINE 0x5000c50006739ac5 1 5 140014 SECONDARY FAILED
经查看可以确定如下信息:
1. 位于1号盘柜,槽位号为5、6的SAS盘组成RAID1; 2. Raid 状态为degrade;
3. 槽位号为5的磁盘状态处于FAILED状态,即需要更换;
说明:磁盘状态为ONLINE时表示正常,为FAILED或MISSING时表示有问题,需要更换。
5. 用相关命令再次确认坏盘位置
sxyy7#[/var/adm/syslog]sasmgr get_info -D /dev/sasd0 -q lun=all -q lun_locate INQ Command status for 12 = 400 Incomplete
RAID VOL ID is 7 :
/dev/rdsk/c3t0d0 0/4/1/0.0.0.0.0
Physical disks in volume are :
1 6 OFF HP EG0146FARTR HPD9
1 5 OFF HP DG146ABAB4 说明:使用此命令再次核对坏盘所在的物理位置,尤其是在指示灯不亮但盘确实需要更换情况下使用更有必要。
6. 在线完成更换
由于/dev/rdsk/c3t0d0做的是raid1即镜像,可以在线热插拔,整个过程在1min内完成。完成更换后注意到新盘Activity LED为绿灯且处于有规律闪烁状态,Status LED不亮。 7.
Drive rebuilding
在更换完硬盘后,新盘马上处于rebuilding状态,此时执行以下命令登录到系统,查看进度:
sxyy7#[/]/usr/sbin/sasmgr get_info -D /dev/sasd0 -q raid ---------- LOGICAL DRIVE 7 ----------
Raid Level : RAID 1
Volume sas address : 0x33a056ea2c1584e Device Special File : /dev/rdsk/c3t0d0 Raid State : DEGRADED
Raid Status Flag : ENABLED RESYNC IN PROGRESS Raid Size : 139236