OCP蹦后(元数据库蹦)重新安装OCP后如何接管回原来的业务集群

【 使用环境 】生产环境
【 OB or 其他组件 】ocp-server-ce 、OBServer-ce:
【 使用版本 】 ocp-server-ce 4.3.5、 ob_server-ce 4.3.1.0
【问题描述】原OCP平台蹦后已无法启动,现重新安装了新版OCP(ocp_server-ce 4.3.5、数据库OBServer-ce4.2.1.8),拟接管原来业务集群(OBServer: 4.3.1.0 OBProxy:4.2.1.0-11)时,报错:Unhandled exception, type=RuntimeException, message=Failed to get ob version
试过连接方式:直连和OBProxy都不可以

1 个赞

连接集群失败,麻烦在ocp server上用命令行连接observer试下 看是否可以成功

在ocp serve 上通过proxy连接不成功,,直连observer数据库,有部分机是可以连,有部分机是不可以的

1 个赞

timeout,网络打通了吗?

2 个赞

在OCP 上的主机按照obclient 连接试一试,提示connect time out 网络不同,可以telnet 试一试
access denied 是白名单限制,access denied for user 是密码不对!
信息参考: 打开或测试连接报错 Access denied -OceanBase数据库使用指南

2 个赞

网络是通的,我都测试过的

账号密码都是一样的,不会有错,我的集群是在原来OCP上创建的(3+3+3),现在发现是我有些服务器是可以直连,有些是不可以直连

1 个赞

直连OB 报timeout ,telnet测试是通的吗?如果通的 可以检查下observer状态是否异常 以及是否有白名单限制

连接5881 报access denied 是因为加了集群名称

连接5883 报access denied 也是因为直连OB timeout的原因

select * from dba_ob_servers;

可以发下不? 去掉敏感信息

image
这个密码 也整理到 ocp里面

  1. 发下odp 的进程 是怎么 启动的 ,是否使用了 历史的ocp
    show parameters like ‘%obconfig_url%’; --截图发下

show parameters like ‘%obconfig_url%’; 在哪里执行这个?

select * from dba_ob_servers;这个执行不了,总是超时咯,不知道是什么情况了

这个查询应该很快,你使用obdiag做下巡检看看

obdiag check run

https://www.oceanbase.com/docs/common-obdiag-cn-1000000002821495

1 个赞

我原来没有安装到这个工具,刚安装的但是配置不了使用

这是连接数据库失败了,您分析下最近1小时的日志看下,参考如下:

obdiag analyze log --from "2023-10-08 10:25:00" --to "2023-10-08 11:30:00" \
  --config obcluster.servers.nodes[0].ip=xx.xx.xx.1 \
  --config obcluster.servers.nodes[1].ip=xx.xx.xx.xx.2 \
  --config obcluster.servers.global.ssh_username=test \
  --config obcluster.servers.global.ssh_password=****** \
  --config obcluster.servers.global.home_path=/home/admin/oceanbase

https://www.oceanbase.com/docs/common-obdiag-cn-1000000002821497

报错是版本问题,查一下ocp和observer的版本