ob集群出现无法连接,无法停止,无法删除表等问题

【 使用环境 】生产环境
【 OB or 其他组件 】ob
【 使用版本 】4.0
【问题描述】
一直都是正常使用,集群突然出现多个应用程序无法连接了,包括idea,python程序。
navicat可以连接,无法删除表。
ocp上面点击很多页面都是报错信息。


rpc error,timeout。
试过重启zone,observer,集群,都超时。停也停不了,假死状态。
麻烦老师帮排查下问题,已经影响正常使用了。

日志呢 :upside_down_face:

rootservice.log.zip (429.0 KB)
observer.log.7z (4.4 MB)

看一下机器的时钟同步是不是正常

此问题已处理,通过手动关停问题节点的observer,重启observer后恢复成功