【 使用环境 】生产环境
【 OB or 其他组件 】 observer
【 使用版本 】4.3.5
【问题描述】
1、因原OCP平台宕机,重新部署了OCP平台,需要使用新的OCP接管原业务集群xcob,但在接管预检测提示observer进程启动为root,无法接管
2、Kill observer 进程后,通过原有参数无法正常启动
【复现路径】
1、在还没kill前,通过ps aux|grep observer查看到了进程信息,启动用户为root ,记录下了启动参数等
2、手动Kill丢了observer进程后,修改observer命令链接路径/root/.odb的权限为xcob用户
3、根据原来查到的参数手动启动observer,但启动不成功
【附件及日志】
observer.log (175.5 KB)
页损坏了?
应该不是的
: Unsupported system page size,这问题上次处理过也有,说是系统配置的数值太大,但是修改不了,不影响observer启动
1.observer进程启动为root,无法接管为什么要去选择杀ob进程?
2.启动ob不带参数试试。这个节点是与其他节点不一样么,使用xco用户启动报错目录权限不足
如果不钉杀了重启,怎可以改为其他用户启动?
权限问题,我上次有处理来,所以这次就按上次的情况修改了权限,这次没报权限问题了咯
[xcob@bc-observer-002 oceanbase]$ cd /home/xcob/oceanbase && ./bin/observer -r ‘172.16.1.26:5882:5881;172.16.1.4:5882:5881;172.16.1.31:5882:5881’ -p 5881 -P 5882 -z zone2 -n xcob -c 1746776140 -d /data -I 172.16.1.4
: Unsupported system page size
./bin/observer -r 172.16.1.26:5882:5881;172.16.1.4:5882:5881;172.16.1.31:5882:5881 -p 5881 -P 5882 -z zone2 -n xcob -c 1746776140 -d /data -I 172.16.1.4
rs list: 172.16.1.26:5882:5881;172.16.1.4:5882:5881;172.16.1.31:5882:5881
mysql port: 5881
rpc port: 5882
zone: zone2
appname: xcob
cluster id: 1746776140
data_dir: /data
local_ip: 172.16.1.4
[xcob@bc-observer-002 oceanbase]$ ps aux |grep observer
xcob 23080 0.0 0.0 213952 1536 pts/0 S+ 11:00 0:00 grep --color=auto observer
这样也是启动不了
进程启动为root,无法接管原因是什么 凭据没有么这个可以手动添加。
log盘权限属主是xco用户么。其他节点都是使用的xco启动的?
其他都是root启动,只有上次出现故障那台31的机器是xcob启动,那个是出故障后手动启动,不能使用root启动,后面修改目录为xcob后可以启动了的,
OCP接管不通过,需要调整observer启动用户
查询下其他节点的oceanbase的home目录都是哪里/root/oceanbase还是/home/xcob/oceanbase?
后续需要先把这个节点铲掉 集群存储路径不一致是无法添加到ocp的。
https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000004476044
嗯嗯,现在有什么办法可以处理好么
先把错误节点删掉使用root再重新添加进来。
这个需要先确认下,其他节点的oceanbase的home目录都是哪里/root/oceanbase还是/home/xcob/oceanbase?
ob拉起进程时候会去读observer.config.bin文件。怀疑你是不是在/root/和/home/xcob下都部署过ob才到参数使用不一致。
应用是部署在/home/xcob/oceanbase,但有部分命令是指向了/root/.obd/repository/oceanbase-ce/4.3.5.1/f0ae44588ae113ac84198d52e62202e001bb3359/bin/
你这个集群是ocp搭建的么
是的,在OCP上创建的集群xcob
学习了
sys租户查询下这个
show parameters like ‘%data_dir%’;
26和31节点是后添加的么?添加节点时候自己手动指定到/data文件了?
默认情况ocp搭建集群data_dir目录为~/oceanbase/store下会将该节点下相关存储目录重定向到/data









