observer 节点故障恢复

【 使用环境 】测试环境
【 使用版本 】 4.2.2 CE
【问题描述】observer 启动失败
【复现路径】

     OCEANBASE_HOME=/home/ob_test/oceanbase

     因模拟节点重启超过 server_parmanent_offline_time的默认值3600秒

    查询 DBA_OB_SERVERS和__ALL_SERVER 视图节点状态均为 INACTIVE

    通过从节点服务器的OCEANBASE_HOME 下执行 ./bin/observer 后进程启动大约1分钟左右自动停止, 日志在不断的刷新

    [2024-06-11 14:17:22.640296] INFO  [STORAGE.REDO] get_next_log (ob_storage_log_reader.cpp:284) [14260][observer][T1002][Y0-0000000000000000-0-0] [lt=0] successfully get next log(entry={magic:-21846, version:1, entry_len:48, entry_checksum:2427480032, cmd:131084, data_len:169, seq:1909412, data_checksum:3296303579, timestamp:1718067152535173}, cursor_=ObLogCursor{file_id=7, log_id=1909413, offset=48691565})
   
   使用root@sys 登陆oceanbase 执行sql语句,执行成功但是无效,启动时间为null   状态依旧为INACTIVE 求解。

   ALTER system start server '192.168.1.54:2882'; 

【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

查一下这张表数据
select * from DBA_OB_ROOTSERVICE_EVENT_HISTORY order by TIMESTAMP desc limit 100;

启动时间点,observer.log发一下

我测试的节点起来了, 我通过对比发现服务器重启后没有ob_mgragent 和ob_monagent 这两个进程, 我使用命令 cd /home/ob_test/obagent/ ./bin/ob_agentd & 后 在执行cd $OCEANBASE_HOME ./bin/observer 就起来了恢复正常了, 请教大佬哪个文档有这些进程的依赖关系

你说的这两个进程是ocp的agent相关进程,不是observer的

是的,我启动了./bin/ob_agentd & 后自动拉起了ob_monagent和ob_mgragent 在启动observer就恢复正常了, 所以我知道observer是否会依赖于这两个进程。有相关的文档可以参考吗

observer不依赖agent进程的。