集群某个节点挂了,怎么恢复或重启单个节点?

【 使用环境 】测试环境
【 OB 】
【 使用版本 】3.1.4
【问题描述】集群某个节点挂了,怎么重启单个节点恢复?

手动重启就可以 进入到安装目录 bin/observer

两种方式:

黑屏:

命令行启动

操作步骤

  1. 用 admin 用户启动 observer 进程。
d /home/admin/oceanbase/
bin/observer [启动参数]可以运行 
使用./bin/observer --help 查看 observer 启动参数的详细信息

详细见官方文档:https://www.oceanbase.com/docs/community-observer-cn-10000000000450678

白屏:

OCP页面进行重启

操作步骤

  1. 登录 OCP。默认进入 集群概览 页面。
  2. 在该页面的 集群列表 中单击集群名,进入集群 总览 页面。
  3. OBServer 列表 部分,单击需要重启的 OBServer 操作列的 重启
    详细见官方文档:
    https://www.oceanbase.com/docs/community-observer-cn-10000000000095685
3 个赞

模拟节点故障:对节点进行重启,然后启动节点
命令1:
/home/admin/myoceanbase/oceanbase/bin/observer -p 2881
命令2:
cd /home/admin/myoceanbase/oceanbase/bin
./observer

上述操作后,均找不到进程:
ps -ef | grep observer

需要重启集群后才正常,请问是什么原因?

1 个赞

原主节点挂了以后,重启该节点CPU居高不小,什么原因?

集群某个节点挂了,重启后异常,可以初始化该节点吗,可以的话该怎么执行初始化操作?

看看observer日志,很可能在回放clog

1 个赞

一般都用ocp白屏直接重启

如果是的话,请问怎么处理呢?

1 个赞

等待clog回放完成

大概需要多久呢?

和未完成落盘的clog量有关,距离上次合并有多久,就会有期间变更的所有数据需要回放

今天凌晨2点已经合并过一次了,合并完后CPU也没下来

那要查下CPU都在干嘛了,参考下https://www.oceanbase.com/docs/enterprise-oceanbase-database-cn-10000000000945511