ocp通过obproxy接管集群失败

【 使用环境 】生产环境
【 OB or 其他组件 】OCP
【 使用版本 】4.3.1
【问题描述】OCP通过obproxy接管集群提示“连接集群obcluster失败, 请检查该集群sys租户root用户凭据是否正确,sys租户白名单设置是否正确,以及网络是否连通”。确认root@sys绝对正确,可以通过其它链接工具正常连接,并且网络也没有问题,通过直连的方式是可以正常接管的。


如果这步填写集群ID,则直接报错。如果不填写集群ID,可以进行到下一步,但在最后提交时报一样的错。


如果root@sys的密码填写错误,哪怕第一步不填写集群ID,也是直接报密码错误的,这点也可以佐证,如果密码有问题,根本无法通过第一步,这个是故意填写错密码的演示

【复现路径】
【附件及日志】

【备注】

1 个赞

proxyro用户的密码你是不是改过。。所用用obproxy接管集群的时候报错

1 个赞

没有的,部署后没有修改过任何密码,用obd cluster display和配置文件确认过链接信息肯定没错,obclient从其它机器连sys租户是可以正常连接的

1 个赞

OCP 有些版本在 OBProxy 接管这个功能里可能有 BUG,也可能是某一步密码设置不对。
建议直接卸载老的 OBProxy,然后用 OCP 全新部署 OBProxy 集群。

如果你有多个 OBProxy 并且前端有负载均衡设备提供 VIP 映射到后端多个 OBProxy 的话,那就是最好的情形了。你可以挨个将 OBProxy从负载里踢掉,然后卸载 OBProxy ,再用 OCP 部署 该 OBProxy,然后再加回负载 里。这个挨个操作,可以做到业务访问无影响。

如果你业务能接受 OBProxy 连接中断一会。那就一起卸载,一起部署。

3 个赞

这个现象看起来不符合预期,obproxy的版本也发下,另外也发下obproxy.log,ocp-server.log
也可以先采用直连方式

obproxy的版本是4.2.3.0,目前我已经按照楼上的方法,删除原来使用obd黑屏部署的obproxy,采用直连的方式接管集群后,从ocp重新部署obproxy,因此无法再提供obproxy的log。我在社区搜索这个问题时,发现在今年7月前,似乎没出现过这个问题,但是在近期4.3版本发布后可以搜到几例,不知道是不是最近的新版本才出现的问题

你之前是用ocp接管obd部署的obproxy吗?

我是用obd黑屏部署的oceanbase-ce 4.3.1+obproxy4.2.3,然后用obd web白屏部署ocp,用这个ocp通过obproxy接管这个集群时,出现这个帖子描述的错误

我们尝试复现下这个问题,有进展回复你

obproxy模式是rs list么,如果是的话,目前已确认为bug,暂时先使用直联方式进行接管。

这个问题已在ocp 432版本修复

1 个赞