observer节点掉线,但是该节点是rs节点,该如何处理?

【 使用环境 】生产环境
【 OB or 其他组件 】OceanBase
【 使用版本 】Server version: 5.6.25 OceanBase 3.1.1 (r1-ad3164d5e72df996e11f9ab1738f577c3b9ff2ce) (Built Oct 12 2021 12:36:51)
【问题描述】集群一共有3*12个节点,目前掉了3个节点,1个rs节点,2个普通节点。集群是基于OBD搭建的,如果手动拉起OBServer进程,需要在启动命令里指定RS的列表,但是现在掉了1个RS节点,需要怎么启动这3台机器上的节点,并把它们加入到集群中?
【复现路径】硬件问题导致的进程死亡
【问题现象及影响】
现在线上的查询中偶尔会报 Partition entry not exists报错,是因为掉了一个RS节点导致的么?
【附件】

1 个赞

麻烦社区的大佬帮忙看看,谢谢!

1 个赞

稍等,我找相关同学看下。

1 个赞

重启不用带参数,在安装目录下运行 ./bin/observer 就行

这个节点已经挂了好多天了,我记得是超过3600s还是多少会进行数据reblance,需要清除数据目录啥的么?这个需要先启动rs节点,还是普通节点?

启动报错:./bin/observer: error while loading shared libraries: libmariadb.so.3: cannot open shared object file: No such file or directory
解决方案:
1、 locate libmariadb.so.3
2、ln -s /root/.obd/repository/oceanbase-ce-libs/3.1.1/6c10e023c19fc761e99d03bbc9576eb8361f4529/libmariadb.so.3 /lib64
3、再重新启动

理论来讲,存储节点数大于n/2 + 1,集群就会没问题啊。
另启动
su - admin
echo ‘export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:~/oceanbase/lib’ >> ~/.bash_profile
. ~/.bash_profile
cd ~/oceanbase && bin/observer即可

有个新节点又掉了,用这个方法加不进去,好像是选举服务起不来,麻烦看看。