在一台windows服务器上安装了oracle em grid control 10.2.0.2,使用已有的数据库作为资料库的。
oracle emgrid 的agent软件安装在各个linux服务器上,用于监控oracle数据库和rac系统。我安装的agent版本是10.2.0.5。
(miki西游的文档,原文链接: http://mikixiyou.iyunv.com/blog/1539937 转载请注明出处,谢谢。)
这个版本安装决定导致了我最后遇到一个大问题,后面会介绍到。
在使用浏览器登录oms服务端时,主机那个项都是正常访问的,可以显示主机的相关信息,如内存,IO等。
但访问到数据库目标时,输入sys连接,则出错了。
检查日志文件D:\OracleEMGridControl\oms10g\sysman\log\emoms.log,报错如下:
2010-05-24 14:06:09,531 [Thread-27] ERROR em.jobs remoteOp.2114 - DBVerify.remoteOp(): CommException: 出现内部错误
2010-05-24 14:06:09,531 [Thread-27] ERROR db.rac populateStatusPage.772 - RacState.populateStatusPage: result from version retrieval had errors.
2010-05-24 14:06:11,593 [EMUI_14_06_11_/console/rac/racState] ERROR db.rac onEndProcess.1069 - RacStateController.onEndProcess: hasErr = true, errType = 6, errMsg= 出现内部错误
2010-05-24 14:06:58,312 [MetricCollector:RACHOMETAB_THREAD600:60] ERROR rt.RacMetricCollectorTarget _getAllData.184 - oracle.sysman.emSDK.emd.comm.CommException: Connection timed out: connect
oracle.sysman.emSDK.emd.comm.CommException: Connection timed out: connect
at oracle.sysman.emSDK.emd.comm.EMDClient.getResponseForRequest(EMDClient.java:1541)
at oracle.sysman.emSDK.emd.comm.EMDClient.getMetrics(EMDClient.java:913)
at oracle.sysman.emo.rac.perform.metric.rt.RacHomeTab._getAllData(RacHomeTab.java:180)
at oracle.sysman.emo.rac.perform.metric.rt.RacHomeTab.getData(RacHomeTab.java:91)
at oracle.sysman.emo.perf.metric.eng.MetricCached.collectCachedData(MetricCached.java:404)
at oracle.sysman.emo.perf.metric.eng.MetricCollectorThread._collectCachedData(MetricCollectorThread.java:596)
at oracle.sysman.emo.perf.metric.eng.MetricCollectorThread.run(MetricCollectorThread.java:320)
at java.lang.Thread.run(Thread.java:534)
分析和解决过程
第一步,在agent服务器上分析agent是否能将监控信息上传到OMS服务器上
/u01/oracle/home@webdg1=>servdb1$emctl upload
Oracle Enterprise Manager 10g Release 5 Grid Control 10.2.0.5.0.
Copyright (c) 1996, 2009 Oracle Corporation. All rights reserved.
---------------------------------------------------------------
EMD upload completed successfully
/u01/oracle/home@webdg1=>servdb1$
如果这一步不成功,就要找agent的问题,或者网络的问题。
第二步,检查OMS端的状态
D:\OracleEMGridControl\oms10g\opmn\bin>opmnctl status
Processes in Instance: EnterpriseManager0.gridctrl01.htsc.com
-------------------+--------------------+---------+---------
ias-component | process-type | pid | status
-------------------+--------------------+---------+---------
DSA | DSA | N/A | Down
LogLoader | logloaderd | N/A | Down
dcm-daemon | dcm-daemon | N/A | Down
OC4J | home | 4576 | Alive
OC4J | OC4J_EMPROV | 4536 | Alive
OC4J | OC4J_EM | 5344 | Alive
HTTP_Server | HTTP_Server | 6080 | Alive
WebCache | WebCache | 3088 | Alive
WebCache | WebCacheAdmin | 2280 | Alive
显示都是正常的
修改了OMS服务器的所在/etc/hosts文件,将所有监控的agent服务器的ip主机名称信息都加入进去。
这里监控的服务器是两台数据库服务器,组成的是一个RAC集群。因此,需要将VIP信息一起加进去。
192.168.15.215 webdg1.htsc.com webdg1
192.168.15.217 webdg2.htsc.com webdg2
192.168.15.216 webdg1-vip.htsc.com webdg1-vip
192.168.15.218 webdg2-vip.htsc.com webdg2-vip
再配置时,报错成这样了。
oracle.sysman.emSDK.emd.comm.CommException: SAXParseException in parsing Response :: Computed columns can be specified only after other columns - SAXParseException in parsing Response :: Computed columns can be specified only after other columns
在metalink文档Cannot Configure Grid Targets [ID 840367.1]中得到这样解释:
Cause
The OMS 10.2.0.2 is too old and its not able to parse the response of the 10.2.0.5 agent
Solution
Upgrade the OMS to 10.2.0.4 or 10.2.0.5
这个环境中agent端确实是10.2.0.5,而oms端是10.2.0.2。只能升级OMS了。
墙内链接: http://mikixiyou.iyunv.com/blog/1539937 转载请注明出处,谢谢。
运维网声明
1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网 享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com