IBM P系列小型机日常维护故障定位故障排除(3)

2020-02-21 18:14

15 用smitty ssaraid 查看磁盘阵列RAID盘的状态是否是Good。如果是degrade或其他

状态表示RAID盘出现问题了

16 用sysdumpdev –l 查看系统的DUMP设置是否正常。

17 用instfix –ik | grep ML当前操作系统补丁版本补丁程序(PTF)是否满足稳定运行的

需要。一般要求433操作系统补丁要打到10以上,5.1操作系统补丁要打到5以上

18 使用df –kP查看磁盘空间占用率,请确保以下文件系统的占用率高于80%立即上报:

/ /var /usr /home /tmp /zxindata/zxinbak,其余文件系统的占用率高于95%立即

上报

也可以到各文件系统下使用组合命令:find . –size +2048 –o ctime 1 –exec ls –l {}

\\; 查出大于1M或一天之内修改过的文件。

nju02 2007-6-7 09:06 2.8性能监控与调优 通过命令vmstat 1 来观察.

kthr memory page faults cpu

----- ----------- ------------------------ ------------ -----------

r b avm fre re pi po fr sr cy in sy cs us sy id wa

命令解析:vmstat 命令的输出可以反映系统整体运行状况,包括cpu、内存、虚拟页面、

系统进程和系统调用情况。

检查CPU是否为瓶颈,分别检查CPU的四项数值和kthr的两项数值.

检查MEM是否为瓶颈,分别检查Memory的两项数值和Page 的六项数值.

通过命令 sar –mu –P ALL 来观察。

命令解析: sar可以用来收集反映系统运行状况,在这里主要是查看CPU的运行状况,CPU

是否负载均衡,是否存在分配不均的情况。

通过命令ps gv | more来观察。

PID TTY STAT TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND

0 - A 4:20 7 12 14516 xx 0 14504 0.0 5.0 swapper

1 - A 1:33 103 78952 79044 32768 25 36 0.0 29.0 /etc/init

命令解析:ps可以用来查看进程的当前状态。在这里通过参数的配搭,可以观察目前正在运行的进程所耗的时间,CPU和memory 量.其中,%CPU表示进程所占用的CPU资源情况,%MEM表示进程所占用的内存情况。主要检查是否有标示为的僵尸进程耗用系统资源,以

及informix 数据库的oninit进程的系统消耗情况。

在机器上用dd命令进行磁盘阵列的写操作校验,与此同时用iostat 1 –d hdiskX观察磁

盘。

Disks: % tm_act Kbps tps Kb_read Kb_wrtn

命令解析: iostat可以用来查看系统的 I/O的输入输出情况,在这里主要查看阵列上的硬

盘的每秒读写量,同时估算磁盘阵列读写速度HHhHhh

通过命令netstat –a 进行查看。

Active Internet connections (including servers)

Proto Recv-Q Send-Q Local Address Foreign Address (state)

命令解析: netstat可以用来查看系统的网络情况,在这里主要是查看网络客户端连接的情况和开销,检查参数为state,如有死连接,state状态为fin_wait, 这样耗用系统网络资

源,从而导致网络性能下降构成瓶颈。

2.9 安全工作守则

a.系统定期进行系统备份,系统盘建议镜像。

b.当有系统变更或进行操作系统补丁安装的时候,必须作一次系统备份。

c.在7133和shark发现有硬盘故障的时候,请提醒客户注意当天的数据备份。在更换硬盘

的时候,请确认当天数据备份已经完成。

d.在更换敏感的电子元件,时候一定要防静电。

e.在插拔外围设备的时候,请把外围设备下电。

f.在进行主机微码升级时候,请留意微码的完整性。

g.在进行文件删除的时候,请留意当前路径是否正确。

h.在进行文件解压缩的时候,请留意参数和路径。

2.10 维护电话

在日常维护中碰到问题和疑难,可以致电:

IBM 免费技术支持保修热线: 800-810-6677 010-64981188-5100

客户技术咨询热线: 800-810-1818

IBM广州分公司联系电话: 020-87553828 6月29日“开源中国开源世界”峰会| Oracle顶级认证,OCM:高薪的象征 | 《开源时代》2010年5月刊 | 参与微软UC沙龙送T恤 [报告] [回复] [引用] qujon 新手 帖子 5 主题 2 精华 0 可用积分 8 专家积分 0 (本版:0) 在线时间 1 小时 注册时间 9 最后登录 1 状态:...当前离线... 第三章、故障定位、故障排除 根据我们在实际商用系统中碰到问题,我们总结出了以下几种常见故障及其定位方式和解决方法。 3.1硬件故障 硬件故障有很多种,对系统产生的影响也不一样,这里按其故障对系统的影响程度分:致命影响的硬件故障和只影响功能的硬件故障两类进行硬件分类: 其损坏对系统产生致命影响(将使机器宕机或无法启动)的硬件包括: 主板、CPU、I/O柜(包含本地盘、光驱、PCI插槽等的柜子)或CEC2楼 发表于 2010-06-21 18:29 | 只看该作者 2010-05-2柜(包含CPU/MEMORY等的柜子)、I/O柜与CEC柜的接线、电源模块、风扇、本地硬盘、内存损坏等等 2010-06-2注:I/O柜和CEC柜一般在比较高端的小型机才有,如M80,低端的是合一的。 [微博] [博客] [短信] 这些设备的损坏等将使系统无法完成自检、引导和启动,液晶显示屏上都将有错误信息,可根据液晶显示屏上的错误码对照Service Guide


IBM P系列小型机日常维护故障定位故障排除(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:崇文区2008年高三第二次模拟考试数学文科

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: