【 使用环境 】生产环境
【 OB or 其他组件 】observer
【 使用版本 】4.3.5.1
【问题描述】
数据库节点zone3服务器死机后, 重启OBserver服务器无法启动,在节点服务器查observer进程没有起来,端口也没起来,通过主机查看ocp_agent是正常,服务器在线。在OCP管理尝试启动节点,提示连接超时,想用新服务器替换也是操作超时。
【复现路径】
在OCP上的OBServer 列表,尝试启动,失败.
执行重装也是失败
操作OceanBase失败,错误信息: (conn=3221658608) Timeout, query has reached the maximum query timeout: 10000000(us), maybe you can adjust the session variable ob_query_timeout or query_timeout hint, and try again.
执行替换服务器也是失败:
登录数据库查看节点信息:
obclient(root@sys)[oceanbase]> SELECT * FROM __all_server WHERE svr_ip = ‘172.16.1.31’;
±---------------------------±---------------------------±------------±---------±-----±------±-----------±----------------±---------±----------------------±------------------------------------------------------------------------------------------±----------±-------------------±-------------±---------------±------------------+
| gmt_create | gmt_modified | svr_ip | svr_port | id | zone | inner_port | with_rootserver | status | block_migrate_in_time | build_version | stop_time | start_service_time | first_sessid | with_partition | last_offline_time |
±---------------------------±---------------------------±------------±---------±-----±------±-----------±----------------±---------±----------------------±------------------------------------------------------------------------------------------±----------±-------------------±-------------±---------------±------------------+
| 2025-05-09 15:37:46.128650 | 2025-12-10 11:07:00.710933 | 172.16.1.31 | 5882 | 3 | zone3 | 5881 | 0 | INACTIVE | 0 | 4.3.5.1_101010042025042417-0c7ffd37c2904f4d8191fb2d056738a93cce6d1d(Apr 24 2025 17:57:24) | 0 | 0 | 0 | 1 | 1765336020709185 |
±---------------------------±---------------------------±------------±---------±-----±------±-----------±----------------±---------±----------------------±------------------------------------------------------------------------------------------±----------±-------------------±-------------±---------------±------------------+
1 row in set (0.011 sec)







