备份注意事项:
进行系统备份无须停止业务,业务可以继续进行。
建议客户进行定期的系统备份(使用命令smitty mksysb)。客户也可根据需要利用SMIT
对系统的特定的VG或FS进行备份。
smitty mksysb只备份rootvg中mount起来的文件系统,其它文件系统或数据并没有做备
份,所以数据备份需要另外完成(建议客户使用TAR格式)
在条件允许的情况下,最好有一盘以上备份带,以防止磁带损坏。
系统备份过程中有时候会提示有些/tmp目录下的文件无法备份,显示如下:
Creating list of files to back up...
Backing up 34025 files..............................
1694 of 34025 files (4%)..............................
2733 of 34025 files (8%).........backup: 0511-449 An error occurred accessing ./
tmp/sh34736.1: A file or directory in the path name does not exist.
backup: 0511-449 An error occurred accessing ./tmp/sh34736.2: A file or director
y in the path name does not exist.
backup: 0511-449 An error occurred accessing ./tmp/sh34736.3: A file or director
y in the path name does not exist.
.....................
15458 of 34025 files (45%)..............................
31920 of 34025 files (93%)...........
0512-003 mksysb may not have been able to archive some files.
The messages displayed on the Standard Error contained additional
information.
这是正常现象,备份成功。
2.5系统恢复
当系统发生比较严重的故障以致采取一般性维护手段不能在短期内恢复原系统,在与客户进行蹉商后,可将最近一次的系统备份带倒回机器内以全面恢复系统到最近一次做备份时的系统环境,然后可将当日的数据备份再倒回系统内。至此,系统可恢复正常运行。此后,客户应当与IBM工程师再进行整个事件的全面分析与回顾,以期找到故障发生的原因,并采取相
应措施以杜绝类似事件再次发生。
2.6 DUMP
当系统运行出现软件故障导致系统down机时,机器的液晶显示器会出现 888 102 xxx 0c0 (xxx可能为700或其它),AIX常会将当时系统的运行情况记录下来,这就是DUMP。
当DUMP产生后,请将磁带放入磁带机,用命令 # snap -a -o /dev/rmt0将DUMP 文件拷贝到磁带设备/dev/rmt0 中。注明磁带机的block size, DUMP产生的日期和机器的型号及序列号。同时,请用# errpt -a >/tmp/err.log 将errorlog 记在/tmp/err.log中,并将 /tmp/err.log 和 /tmp/hacmp.* 拷贝到软盘或磁带上。将磁带和软盘交给IBM工程师。
2.7日常检查服务器状态的项目及其相关命令
1 运行lsdev 命令配以各种参数,所列各种设备状态都应为Available。
#lsdev –C –H –S a 列出系统中可用设备。
#lsdev –Cc processor 列出系统中的所有CPU。
#lsdev –Cc memory 列出系统中的所有内存。
#lsdev –Cc disk 列出系统中的所有硬盘。
#lsdev -Cc adapter | grep ent 列出系统中的所有网卡
#lsdev -Cc adapter | grep scsi 列出系统中的所有SCSI卡。
#lsdev -Cc adapter | grep ssa 列出系统中的所有SSA卡。
2 lspv命令
#lspv 显示系统中可用的PV。
#lspv hdiskn 显示hdiskn的具体信息。
#lsdev –Cc pdisk 显示磁盘阵列的硬盘的具体信息。
对SSA硬盘的检测:在对主机进行工作之前可以先把磁盘阵列上电,等主机完全启动后,登录到主机上,运行以下命令“ lsdev –Cc pdisk “,应该可以看到所有SSA硬盘,并且状
态应为Available.。
3 lsattr命令
# lsattr –E –l mem0 列出系统中内存mem0的大小,本项目中内存有4GB。
4 lsvg命令
#lsvg 列出系统中所有的vg。
#lsvg rootvg 列出rootvg的详细信息。
#lsvg –o 列出激活的vg
5 oslevel命令
#oslevel 显示操作系统版本信息。
6 netstat命令
#netstat –in 显示系统中各网卡的配置。可查看网卡的IP配置好了没有。
7 通过运行# diag 命令运行硬件诊断程序检测主机内所有硬件,检测结果为 “No trouble
found ”显示各部分工作正常。
8 使用#diag命令(选择:Task Selection-> SSA Service Aids)对SSA硬盘链路连接的校验,可以通过SSA 工具里的Link Verification 来检测。如有必要,可以用 Certify Disk运行硬盘诊断部分进行硬盘的表面分析测试 ,由1% 至100%,检测结果显示主机内置硬盘
的所有扇区均读写正常。
9 lsps –a 查看PAGING SPACE的使用情况,如果使用率超过70%,就需要采取措施。
10 lsvg –o | lsvg –il | grep –i stale查看有无stale的lv,如果输入该命令之后
有输出结果,就需要采取措施
11 有否发给root用户的错误报告(mail)。
12 检查双机状态:lssrc –g cluster 检查ha三个工作进程是否激活,
/usr/sbin/cluster/clstat –a检查双机状态是否up,并检查hacmp.out日志,看是否有
异常信息。
13 用vmstat, topas,sar 命令检查系统性能,检查cpu\\memoyr\\IO ,是否存在性能瓶颈。
14 检查能否顺利进入CDE界面,如果不能进入的话,要检查/etc/hosts表中有否错误的
项目。