我的oceanbase集群部署了3个zone,每个zone下一个节点。在做高可用POC时候kill 掉了zone1节点上的observer,重新拉起时失败,报错信息为[errcode=-4388] Unexpected internal error happen, please checkout the internal errcode(errcode=-4147, file=“ob_server.cpp”, line_no=1887, info=“some config setting is not valid”。在这期间没做过任何系统配置的修改。具体日志上传如下。
observer.log (139.8 KB)
SHOW VARIABLES like ‘version_comment’;
上面的发的日志 是重新拉起来的日志信息么?是这个时间开始拉起来的么?2025-11-28 10:39:24.310537]
[2025-11-28 10:39:24.310646] INFO [SHARE] load_config (ob_config_manager.cpp:129) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=10] Config file doesn’t exist, read from command line(path=“etc/observer.config.bin”, ret=-4027)
看着是这个配置文件缺失了或者是读取不到了 自己检查一下 下面的报错都是基于上面找不到这个文件了 报的错
[2025-11-28 10:39:24.314884] WDIAG [SHARE] strict_check_special (ob_server_config.cpp:147) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=9][errcode=-4147] invalid cluster id(ret=-4147, cluster_id.str()=“0”)
[2025-11-28 10:39:24.314900] ERROR issue_dba_error (ob_log.cpp:1875) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=7][errcode=-4388] Unexpected internal error happen, please checkout the internal errcode(errcode=-4147, file=“ob_server.cpp”, line_no=1887, info=“some config setting is not valid”)
[2025-11-28 10:39:24.314925] EDIAG [SERVER] init_config (ob_server.cpp:1887) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=25][errcode=-4147] some config setting is not valid(ret=-4147, ret=“OB_INVALID_CONFIG”) BACKTRACE:0x1204f5bc 0x505bb05 0x51541fd 0x5153cbf 0x5140314 0x5153b63 0xa6ddab6 0xa6b4ecc 0xa6a9f25 0x72aa714 0x1488ba75a687 0x52d08de
[2025-11-28 10:39:24.315013] ERROR issue_dba_error (ob_log.cpp:1875) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=85][errcode=-4388] Unexpected internal error happen, please checkout the internal errcode(errcode=-4147, file=“ob_server.cpp”, line_no=264, info=“init config failed”)
[2025-11-28 10:39:24.315020] EDIAG [SERVER] init (ob_server.cpp:264) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=7][errcode=-4147] init config failed(ret=-4147, ret=“OB_INVALID_CONFIG”) BACKTRACE:0x1204f5bc 0x505bb05 0x51541fd 0x5153cbf 0x5140314 0x5153b63 0xa6b66c4 0xa6ac43d 0x72aa714 0x1488ba75a687 0x52d08de
[2025-11-28 10:39:24.315038] INFO [LIB] set_param (achunk_mgr.cpp:42) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=16] set large page param(large_page_type_=0)
[2025-11-28 10:39:24.315043] INFO [SERVER] set_stop (ob_service.cpp:318) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=4] [OBSERVICE_NOTICE] observice need stop now
[2025-11-28 10:39:24.315059] INFO [SERVER] set_stop (ob_server.cpp:1142) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=11] [OBSERVER_NOTICE] observer is setted to stop
[2025-11-28 10:39:24.315063] INFO [SERVER] destroy (ob_server.cpp:530) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=3] [OBSERVER_NOTICE] destroy observer begin
[2025-11-28 10:39:24.315067] INFO [SERVER] destroy (ob_server.cpp:532) [1240142][observer][T0][Y0-0000000000000000-0-0] [lt=4] begin to destroy config manager
是的,重启之前把日志清空了一下
你这个集群是obd部署的么?如果是发一下obd的yaml配置文件
你把启动的命令发一下 看看怎么启动的
你在看一下observer下的etc目录 是否缺失文件 你对比一下其他的节点 你在截个图
observer下的etc目录不缺少文件,我把observer下etc的文件拷到那个错误生成的etc目录下,再执行/bin/.observer,就可以正常启动了
你查看一下其他的节点 是不是也是这样
其他节点的目录是正常的,没有错误生成的etc目录
obd的log也发一下 默认保存在安装obd的用户home路径: cd ~/.obd/log/
抱歉,需要下周发,文件在内网,负责内网文件发送的同事下班了.
好的 先保存一下

