使用obd启动oceanbase集群报错,错误码2002,OBD-2002:Failed to start 192.168.xx.xxx observer

【 使用环境 】测试环境
【 OB or 其他组件 】OB
【 使用版本 】社区版V4.2.2
【问题描述】使用obd重新启动oceanbase集群,无法启动,错误日志:observer program health check x,oceanbase-ce start failed
【复现路径】在启动之前,因为systemd进程占用cpu较高,所以杀掉了systemd进程
【附件及日志】
oceanbase错误日志.txt (4.4 KB)
observer.log.wf.log (1.9 MB)

看 log 是启动observer时,检测到指定的网卡发生了变动。
你有做什么前置操作吗,或者是对obd或oceanbase进行了升级?

启动之前用了obd demo命令

网口的位置换过,换过的网口ip地址是没变化的,这个有影响吗

和昨天的 服务器重启后oceanbase 启动报错 checksum error ret=-4103 - #10,来自 piping 帖子是一个环境吗?

看报错也是 二进制的配置文件 初始化失败 是手动修改过配置文件吧。

ERROR issue_dba_error (ob_log.cpp:1853) [3435695][observer][T0][Y0-0000000000000000-0-0] [lt=810][errcode=-4388] Unexpected internal error happen, please checkout the internal errcode(errcode=-4103, file=“ob_server.cpp”, line_no=263, info=“init config failed”)

有手动修改过,但是又改回来了,因为内存不够所以改了发现不生效,然后又改回来了。

可以使用参数方式启动看看。参看上面链接的操作方式。

以下是我使用命令的方式启动
admin@krkj-2288X:~/myoceanbase/oceanbase$ /home/admin/myoceanbase/oceanbase/bin/observer -r ‘192.168.18.183:2882:2881’ -p 2881 -P 2882 -z ‘zone1’ -n ‘myoceanbase’ -c 1705996029 -d ‘/home/admin/myoceanbase/oceanbase/store’ -i ‘’ -I ‘192.168.18.183’ -o __min_full_resource_pool_memory=2147483648,datafile_size=‘200GB’,datafile_maxsize=‘300GB’,datafile_next=‘10GB’,log_disk_size=‘100GB’,memory_limit=‘16GB’,system_memory=‘2GB’,enable_syslog_recycle=True,enable_syslog_wf=False,max_syslog_file_count=4,cpu_count=18
/home/admin/myoceanbase/oceanbase/bin/observer: error while loading shared libraries: libmariadb.so.3: cannot open shared object file: No such file or directory

/home/admin/myoceanbase/oceanbase/下应该有个lib目录
执行一下export LD_LIBRARY_PATH=’/home/admin/myoceanbase/oceanbase/lib’

看你observer的log里,
[2024-03-22 15:09:46.323952] WARN init_config (ob_server.cpp:1849) [3437543][observer][T0][Y0-0000000000000000-0-0] [lt=4][errcode=-4187] Item not match(the devname has been rewritten, and the new value comes from local_ip, old value=“bond0”, new value=“ens3f3”, local_ip=“192.168.18.183”)
启动observer解析出的devname跟config.bin中记录的不一致,你可以把网口改回来试一下

网卡已经改过来了,export那个命令也都执行了,发现还是不行,错误还是相同的。

history二进制文件替换上试试。这个持久化配置文件是不能直接手动修改的。
然后使用带参数方式启动。

使用history文件替换之后,可以启动出现的错误observer need bootstarp x。OBD-5000: select * from oceanbase.__all_server execute failed

需要看下observer.log日志

observer.rar (1.1 MB)
1711334254256

strings observer.config.bin
strings observer.config.bin.history

对比下是不是有哪些区别。

另外需要杀掉observer.log 重新启动,提供最新的observer.log,之前的日志覆盖了一些初始化信息。

observer11.rar (5.4 MB)


对比了两个文件未发现异常,已重新提交日志

看下磁盘和配置文件 df -h && free -h && ip a 配置文件( ~/.obd/cluster/depolyname/config.yaml)