手动拉起obproxyd进程后,根据官网提供的ocp监控obproxyd进程的命令ps -ef|grep -w obproxyd.sh|grep -v grep|wc -l 查看 结果是1,但是ocp依旧持续报警 这个是否符合预期
个人猜测是不是因为采集太频繁导致的告警堆积
碰到过。估计是 ocp bug。要么升级 ocp ,要么你干脆再用 ocp 重启一下那个 obproxy。 ocp 自己拉起的 进程 自己还是认的。
1 个赞
ocp版本和obproxy版本麻烦提供一下
OCP是422
OBProxy是421
到问题机器上看下curl --unix-socket /home/admin/ocp_agent/run/ocp_monagent.$(cat /home/admin/ocp_agent/run/ocp_monagent.pid).sock http://unix-socket-server/metrics/node/obproxy 监控接口返回值
我把obproxy和obproxyd.sh的进程都杀掉后 通过OCP强制重启后这个告警就消失了 这是不是一个BUG呢 OCP识别不到手动拉起的obproxyd.sh这个进程
我记得好像确实是个已知的问题。
刚才的监控接口返回值有查看么
应该是,我也遇到了。
我的处理办法更暴力:odp不存储数据,直接删除重建
我看他返回了很多行 有对应机器的IP地址 具体内容没细看
还有记录么 麻烦发出来看一下
抱歉 这个没做相关记录
没事。问题解决了就行
是已知bug,在OCP 430已修复
学习了