OB服务器无法连接

概述:一套1-1-1模式的测试环境;没关集群的情况下服务器断电了,然后OCP告警三台OB服务器无法连接,进入observer服务器observer进程已经不存在,手工使用./bin/observer命令也无法启动(3台),麻烦各位大佬指导一下

1.集群状态


2.observer
图片

图片

图片

3.restartZONE失败


log_task_104002536 (1).zip (36.7 KB)

4.OCP和AGENT都重启过了,没解决问题,OCP显示集群处于运维状态,啥也操作不了,求大佬给个排查思路

手动启动 observer 进程的时候 目录必须在软件目录 oceanbase 下。默认是在 /home/admin/oceanbase
所以 启动方式是:

su - admin
cd /home/admin/oceanbase && bin/observer

你是ocp部署的集群吗,我看你黑屏用root用户起?文件权限会被修改的呀;你现在ocp上可以启动实例吗

OCP部署的集群,启动的时候忘切换用户了,现在用admin起的,还在启动中,但我看有报错,请问啥文件权限会被修改啊

你看看observer的文件,data、clog目录,看看权限有没有问题

大佬,这个必须在oceanbase目录下执行吗?和进入到bin目录执行./observer有区别嘛

那你直接在ocp上启动执行吧

可以参考这个,官方标准

zone1,zone2已经启动成功了,但是zone3一直起不来,手工启动没反应,OCP操作不了,显示重启中。但是已经重启很久了,任务里不管是终止执行还是放弃任务,都会重新执行stop server步骤,然后卡着不动



看看日志吧。麻烦提供下observer.log日志和右上角的下载日志。

代回复,