【 使用环境 】生产环境
版本:4.2.1.1
问题:连接observer时会出现连接缓慢的情况,OCP显示集群不可用,这种问题要如何排查呢

应该是集群状态的问题,可以看下集群为啥不可用了,重启是否可恢复
集群状态时好时坏,应该是ocp连接集群查询sql超时了,把所有的节点都排查了一遍,发现有几台observer连接很慢很慢。重启server进程也没能恢复
可以试试用obdiag先巡检一下看看
安装:https://www.oceanbase.com/docs/common-obdiag-cn-1000000000441301 (提示用户使用独立部署使用方式安装)
巡检:https://www.oceanbase.com/docs/common-obdiag-cn-1000000000441294
连接串-A oceanbase改成 -Doceanbase -A试试呢
还是不行
这个场景可以稳定复现么
现在我们把业务都切走了,那些server节点连接还是很慢
是一直慢么,还是突然慢了,可以先使用obdiag巡检看下。
从集群监控方面看是突然慢了,我们也用过obdiag,但涉及用户权限问题分析失败了
是什么权限问题呢,最好是使用obdiag尝试分析一下。
那几个问题节点的cpu或磁盘压力是否有异常升高呢
现在没有业务了cpu、磁盘压力都很小。因为ssh连接用户和clog文件的用户不是一个,没有读clog文件的权限
目前不需要读clog的权限,只要log的读取权限即可
是虚拟机部署还是物理机呢