多派数节点宕机后恢复ob的集群

除了磁盘问题,端口占用问题,可以把节点上的obs obp进程杀掉 再启动。

我将服务器重新启动然后重启了一下集群现在三个节点正常了,然后有个问题就是想问一下如果我发现我之前改的内存的值当我重启整个集群或者是我重启我的服务器我修改的内存值又回到了之前的大小


想问一下这个我怎么持久化呢,就是我重启的集群的时候我修改的值不失效

memory_limit是支持动态调整,且会持久化,看下memory_limit当前值,可能是内存不足申请不到。可以清理内存,并调大该参数。

麻烦老师这个在哪看呢

obclient [oceanbase]> alter system set memory_limit=‘10G’;
我使用的这个命令然后在开机加重启就不行了

obd cluster edit-config 部署名称, 修改内存 再重启看下。

image
老师是这样操作的么?

看提示是 不存在xhws2部署名称。 是不是写错了。

老师,这个是我写错了,使用obd cluster list 查看集群名然后在使用obd cluster edit-config demo 集群名然后改了一下内存大小,这个正在测试是否重启生效
老师现在有个问题就是我将3个节点中的一个节点手动kill然后在想启动的时候状态不对


是我拉起的命令不对么?
alter system start server ‘10.0.4.7:2890’ zone ‘xjws1’;
说明:2890是rootserver的端口号
2889是ob的端口号2891是obproxy的端口号(我更换了端口号)
image
在4.7服务器中查看不到端口号

问题1:
alter system start 使用的是端口是rpc_port 默认是2882 ,现场自定义的端口是2889(mysql_port)和2890(rpc_port),对应的是2890,和obproxy端口(默认2883,2884)无关。
问题2:
关于你这个节点没有obs进程,首先start server 并非启动ob进程命令。

正确的操作方式: OCP进行节点启动。

老师这个启动节点命令行的方式是什么,我的这个ocp是简洁版好像没有启动节点的按钮


老师这个节点的状态提示不可用是谁不可用了呢?我用命令查看我的zone是激活的啊


老师想问一下这两个为啥查到的zone的状态不一样呢?

obd cluster start name -c 指定组件 -s 节点 启动。
或者看下这个 【SOP 系列 19】OceanBase 生态组件重启方式


老师,我启动报
Get local repositories and plugins ok
Load cluster param plugin ok
Open ssh connection ok
Cluster status check ok
Search plugins ok
Load cluster param plugin ok
Cluster status check ok
Check before start observer x
[ERROR] OBD-2008: Cluster clocks are out of sync
Check before start obproxy ok
Check before start obagent ok
Check before start ocp-express ok
[ERROR] OBD-1005: Some of the servers in the cluster have been stopped

clockdiff xx.xx.xx.xx 延迟不能超过100ms 如果超过需要安装ntp做时间同步 否则节点会下线的。

好的,我试了一下可以正常启动了.


麻烦老师帮忙看看上面的问题

按上面的方式 alter system start server 看下


启动了还是不行

可以先安装下obdiag诊断工具 做个日志分析和检查。

好的,我使用alter system start server '10.0.4.8:2890’的命令感觉不生效,需要执行如下的命令才可以
obd cluster restart myoceanbase -c oceanbase-ce -s 10.0.4.8
我暂时用不了obdiag这个工具好像不支持ocp的简洁版,它好像需要依附于ocp的完整版,我之前装的好像就卡在这个地方了

obdiag单独安装方式。
https://www.oceanbase.com/docs/common-obdiag-cn-1000000000441302