ocp突然挂了,重装了ocp再重新接管原来的ob集群操作OceanBase失败,错误信息: (conn=803467) (conn=803467) Connection is closed

【 使用环境 】生产环境 or 测试环境
原ocp版本 4.2.1(单机部署,ocp+ocp用的ob数据库 都在同一台机器上) 上面托管了一套OB 版本是 4.2.10
ocp 挂了,怎么都启动不了,于是将ocp机器整个格式化,再重新部署了一套OCP
新部署OCP版本为:4.3.4
【问题描述】
现在使用新的OCP去接管原来的ob集群(用的odp 2883),提交后,等很久之后报错:
操作OceanBase失败,错误信息: (conn=803467) (conn=803467) Connection is closed


2 个赞

麻烦发下ocp-server.log

1 个赞

使用的为2881本地端口接管的么。建议使用2881的试一下

用2881这一步过了,但出现另一个问题,错误码
CMP07053
错误信息
为了保障 OceanBase 稳定运行,建议您使用 SSD 类型磁盘,若您使用 HDD 类型磁盘,请确保数据盘 IOPS 大于 1000, 日志盘 IOPS 大于 2000,否则系统极易出现线程积压、打爆 CPU/ IO 等情况,造成业务影响

这个可以跳过吗,三台机器都是一样的磁盘,就这台过不了

1 个赞

这一步可以跳过

2 个赞

断掉之后重新接管回来ocp,断开期间对集群的黑屏操作,以及其他元数据还能补回来吗?

1 个赞

可以试着跳过看看

就是只能2881吗?什么原理?ocp重装后,就只能用2881接管之前接管过的老的集群了吗?

用户应该是遇到个boproxy的bug。当前无法使用RList模式的obproxy接管ob集群

1 个赞

所以就绕开这个bug,二装的ocp就用2881绕过obproxy,这样解决了?谢谢

1 个赞

是的,如果使用的config URL模式的obproxy就不会有这样的问题

确实是Rlist 模式的obproxy