Ultrapower
原因分析3:
初步判断为主机安全级别较高,安装权限不够
解决问题3:
安装完报错后不要卸载
以patrol 用户 su – root,进入到$PATROL_HOME/PATROL3下 ./agent_configure.sh –d ./b1config*.sh 完成后覆盖安装
以上方法适用于AIX、HP_UX、Solaris8/9/10 ~
1.9 双机浮动IP与物理IP----控制snmpmag帮定IP的办法
patrol 版本:9211 OS版本: AIX 问题描述:
patrolagent安装完毕,patrol安装目录/Patrol3/lib下的snmpmagt.cfg已经将199改为了8199,并且config.default中199也改为了8199 然后启动PatrolAgent后,snmpmagt会很快宕掉
原因分析:
检查网络连接时发现以下问题
$ netstat -an|grep 8199
tcp4 0 0 202.248.42.136.48742 202.248.42.205.8199 SYN_SENT tcp4 0 0 *.8199 *.* LISTEN
检查系统的host文件发现以下问题
$ hostname sxltscp2_1 $
$ more /etc/hosts
127.0.0.1 loopback localhost # loopback (lo0) name/address 202.248.42.205 sxltscp2_1_boot sxltscp2_1
28357950.doc
16/32
Ultrapower
192.168.0.5 sxltscp2_1_stby sxltscp2_1 202.248.42.206 sxltscp2_2_boot sxltscp2_2 192.168.0.6 sxltscp2_2_stby sxltscp2_2 202.248.42.136 sxltscp2_svc
$ netstat -in
Name Mtu Network Address Ipkts Ierrs Opkts Oerrs Coll en0 1500 link#2 0.14.5e.c5.53.3e 19825126 0 8381946 0 0 en0 1500 202.248.42 202.248.42.136 19825126 0 8381946 0 0 en2 1500 link#3 0.d.60.51.b.a2 451333 0 120558 0 0 en2 1500 192.168.0 192.168.0.5 451333 0 120558 0 0 lo0 16896 link#1 1458934299 0 1459218125 0 0 lo0 16896 127 127.0.0.1 1458934299 0 1459218125 0 0 lo0 16896 ::1 1458934299 0 1459218125 0 0
由以上可以分析出,此服务器的物理IP是202.248.42.205,而浮动IP是202.248.42.136,此双机软件版本应该是4.1 的,当浮动IP在哪台机器上运行则其物理IP不可用
而PatrolAgent是通过host文件解析出sxltscp2_1的ip为202.248.42.205,故会使用202.248.42.136去连接202.248.42.205的8199,刚好与AIX双机机制有冲突,导致snmpmagt无法启动。
解决办法:
思路:让snmpmagt启动时绑定当前活动的IP地址
注意:以办法只适用于AIX双机系统,并且双机是浮动IP会取代物理IP的环境
解决步骤:
(双机的两台机器都要做,以避免双机切换时的问题) 先将../Patrol3/PatrolAgent文件进行备份
再按以下步骤修改../Patrol3/PatrolAgent文件
在开始添加以下行
注意:202.248.42是当前服务器所使用的IP前三位
NMS_FIP=`netstat -in|grep 202.248.42|awk '{print $4}'` NMS_OSTR=`grep 199 ./lib/snmpmagt.cfg` NMS_NSTR=\
sed \mv ./lib/snmpmagt.cfg ./lib/snmpmagt.org mv ./lib/snmpmagt.temp ./lib/snmpmagt.cfg
28357950.doc 17/32
Ultrapower
1.10 PatrolAgent for Unix安装过程中使用的URL提供的IP与外网不通。
在安装程序的setup.sh中增加一个参数“-host_override IP”,该IP必须与安装Patrol的Windows服务器相通。
1.11
1.11 PatrolAgent为root权限
先确认$PATROL_HOME/bin/PatrolAgent的文件权限是否正确:root用户属主,owner具有setuid bit;再确认patrol用户可以登录操作系统,对patrol的$HOME以及/tmp目录具有读写执行权限。 1、停止PatrolAgent
2、删除$PATROL_HOME/config目录下的配置文件
3、patrol用户执行Patrol3下的PatrolAgent启动(./PatrolAgent)
如果还报上述错误,则使用wpconfig 连接agent,重新输入/AgentSetup/defaultAccount中的patrol用户以及patrol密码,然后重启Agent
1.12
1.12 Fri Jan 7 10:58:54 2011 PatrolAgent-E-EUSER: Syntax error(s) in PSL program
有几台主机PatrolAgent重新启动后,提示以下错误,查看进程时,发现用户变为root: patrol@SZXNTP02:~/Patrol3> PatrolAgent -p 3181 & [1] 2761
patrol@SZXNTP02:~/Patrol3>
PatrolAgent V3.6.50i, built at 14:09:17, Feb 10 2005 Copyright (C) 1997-2005 BMC Software, Inc.
Fri Jan 7 10:58:54 2011 PatrolAgent-E-EINTERNAL: Please change the configuration variable '/AgentSetup/defaultAccount' with [x|w]pconfig or the developer console
NO work will be done until a valid account is specified
in the configuration variable '/AgentSetup/defaultAccount'
(/data/patrol_p4/p4build/Patrol/3.6.50/src/agent/startdbmsrv.c 3436)
Fri Jan 7 10:58:54 2011 PatrolAgent-E-EUSER: Syntax error(s) in PSL program for discovery of application 'SPACE_EXPERT_ORA' -- discovery disabled.
patrol@SZXNTP02:/> ps -ef|grep Patrol
root 2779 1 0 10:58 ? 00:00:00 PatrolAgent -p 3181 patrol 8383 27088 0 11:17 pts/3 00:00:00 grep Patrol
解决方案
方法一:先打开wpconfig接入主机,从AgentSetup下找到defaultAccount项,修改patrol密码。
如果以上方法还不能解决,则用方法二。
方法二:修改$HOME/Patrol3/lib/config.default文件,搜到
'/AgentSetup/defaultAccount' 这行,在后面的字段中修改patrol密码。 一般情况任意一种方法均可解决。
28357950.doc 18/32
Ultrapower
先确认$PATROL_HOME/bin/PatrolAgent的文件权限是否正确:root用户属主,owner具有setuid bit;再确认patrol用户可以登录操作系统,对patrol的$HOME以及/tmp目录具有读写执行权限。 1、停止PatrolAgent
2、删除$PATROL_HOME/config目录下的配置文件
3、patrol用户执行Patrol3下的PatrolAgent启动(./PatrolAgent) 如果还报上述错误,则使用wpconfig 连接agent,重新输入
/AgentSetup/defaultAccount中的patrol用户以及patrol密码,然后重启Agent
Thu Jan 20 10:14:40 2011: ID 10202e: E: Configuration Error: Error loading file \
现场的config.default文件修改的不正确。
现场告诉我patrol用户的密码以及rtserver的地址、端口号,我给你修改config.default吧。
1、 停止PatrolAgent
2、patrol用户使用附件中的替换$PATROL_HOME/lib下的config.default 3、将$PATROL_HOME/config目录下的配置文件移走备份 4、启动PatrolAgent并重新配置
patrol密码相同,可以用这个config.default,如果不同,则需要计算patrol密码的密文,然后替换config.default中\{ REPLACE=\
注:密文不是通过pencrypt工具计算出来的。修改此文件时一定要保证格式正确。 其密文可以通过wpconfig 工具查看(如附件password.png所示)
2
Windows安装问题
28357950.doc 19/32
Ultrapower
2.1 启动patrolagent时报告无效的用户后停止
patrol 版本:3003
OS版本: WINDOWS SERVER 问题描述:
This problem only occurs if PATROL KM for Event Management is installed. The following is observed in the PATROL Agent error log: Fri Jan 23 13:29:46 2004: Logon failure: unknown user name or bad password. --> user: patrol, logon type: LOGON32_LOGON_NETWORK Fri Jan 23 13:29:46 2004: Fri Jan 23 13:29:46 2004 PatrolAgent-W-EINTERNAL: Invalid user 'patrol' Fri Jan 23 13:29:46 2004: Fri Jan 23 13:29:46 2004 PatrolAgent-E-EINTERNAL: Please change the configuration variable '/AgentSetup/defaultAccount' with [x|w]pconfig or the developer console NO work will be done until a valid account is specified in the configuration variable '/AgentSetup/defaultAccount' Fri Jan 23 13:29:47 2004: ID 102062: I: PatrolAgent terminating Fri Jan 23 13:29:47 2004: ID 1021c7: W: History File Closing Failed Fri Jan 23 13:29:47 2004: ID 1021c6: I: PEM File Closed Successfully
原因分析:
As the PATROL Agent has terminated, it is not possible to use a utility such as pconfig to change the default account
28357950.doc
20/32