今早接到反馈,在客户部署的OEM(版本 13.5)监控失效,提示代理无法访问,无法访问的除了数据库以外还有主机都显示数据不可用。
以上图片上信息可以看到代理无法访问开始时间是5号的晚9点,那这个时间段很明显我方对数据库更新过一个bug补丁。
提示:以下是本篇文章正文内容,下面案例可供参考
排查了OEM服务器的本地磁盘、数据库状态以及alert日志信息,没看到异常信息,相应的oms和agent服务均online
重启agent以及oms:
重启OEM的相关服务后没有成功,现在就排除了oem服务问题,那就只能是数据库主机上agent的问题了。
通过find命令查找相应目录位置
find / -name "agent"
两个节点均启动agent服务:./emctl start agent
启动agent后oem需要1分30秒以后才可以获取到数据,耐心等待下。