OceanBases社区版OCP云平台无法打开-

【 使用环境 】 测试环境
【 OB or 其他组件 】
OCP V4.3.5
【 使用版本 】
【问题描述】清晰明确描述问题
ocp出现告警,在web端重启服务后ocp云平台web无法打开

1 个赞

有详细的情况说明吗,告警内容,重启方式截图啥的,还有ocp的日志

1 个赞

ocp-server.log (1.9 MB)

meta库能正常连接不,2881和2883测下

[root@ocp-22 log]# obclient root@10.202.22.58 -P 2883 -p
Enter password:
ERROR 2002 (HY000): Can’t connect to OceanBase server on ‘127.0.0.1’ (115)

这个ocp不重要,重新部署一台ocp能不能接管现有的数据库,三个zone区域

日志里的报错有clockdiff 多个ip的失败记录,涉及到服务器重启了吗,检查下ocp机器和集群各节点的时钟

时钟均正常,之前是告警过,已经处理

meta就没起来?

ocp的数据库是在本机单机节点,不在集群内

能接管,有proxy吗,我前几天写了个接管的,可以看下 数据库技术博客-OceanBase分布式数据库

所以能不能不要这台了,直接重装一台ocp,然后把其他的机器加入新的ocp平台

现在就是云平台的web打不开了,无法操作

Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name
tcp 0 0 0.0.0.0:2882 0.0.0.0:* LISTEN 2035/observer
tcp 0 0 0.0.0.0:2881 0.0.0.0:* LISTEN 2035/observer
tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1473/sshd: /usr/sbi
tcp6 0 0 :::62889 :::* LISTEN 1783/ocp_monagent
tcp6 0 0 :::62888 :::* LISTEN 1782/ocp_mgragent
tcp6 0 0 :::22 :::* LISTEN 1473/sshd: /usr/sbi
udp 0 0 127.0.0.1:323 0.0.0.0:* 1392/chronyd
udp6 0 0 ::1:323 :::* 1392/chronyd

web端口8080没有被监听,怎么重启web服务

ocp是obd装的吗,可以obd cluster restart。不行就重装ocp再接管集群,只是会丢历史监控数据

[root@ocp-22 log]# obd cluster restart myocp
[ERROR] Deploy “myocp” is configured. You could not restart an configured cluster.
See https://www.oceanbase.com/product/ob-deployer/error-codes .
Trace ID: 857161ae-e9e0-11f0-889e-005056aabb47
If you want to view detailed obd logs, please run: obd display-trace 857161ae-e9e0-11f0-889e-005056aabb47

新ocp接管的话不是需要先迁出吗?

[root@ocp-22 log]# obd cluster list
±-----------------------------------------------------------+
| Cluster List |
±----------±-----------------------------±----------------+
| Name | Configuration Path | Status (Cached) |
±----------±-----------------------------±----------------+
| hzdb | /root/.obd/cluster/hzdb | running |
| ocpserver | /root/.obd/cluster/ocpserver | running |
| myocp | /root/.obd/cluster/myocp | configured |
±----------±-----------------------------±----------------+
Trace ID: 3be664c0-e9e1-11f0-bbd8-005056aabb47

原ocp不可用的情况下,新ocp直接接管就可以,不用先迁出

不需要先迁出,可以直接接管,迁出是为了清理原ocp上的信息,以及agent信息,原ocp不可用,自己清理下agent,直接接管就行

好的,agent是去每台主机上清理吗,有教程吗