【 使用环境 】生产环境
【 OB or 其他组件 】ocp4.3.5 ob4.3.5
【问题描述】
ocp告警节点停服了,登录对应机器排查了下,发现两次oom,ocp上面停服了两次。
报错信息不清晰啊
建议发出ocp告警截图
节点是否可以拉起来呢?
可以的。第一次停了,我给手动恢复了。现在又停了
1 个赞
蹲一个
ob集群在异常前是否存在高负载的情况,集群的资源信息截个图,另外点击告警,查看下告警详细信息
是不是日志盘满了?麻烦提供一份宕机时间段的observer日志。
和日志盘应该没关系,上面我看是oom啊,硬盘还有很大的空间啊。
我们是单节点异常了,是要看异常节点的吗?
是的