OCP-4.3.2服务断电重启失败

【 使用环境 】 测试环境
【 OB or 其他组件 】 OCP
【 使用版本 】

ocp-all-in-one-4.3.2-20241012145836.el7

【问题描述】清晰明确描述问题

服务由于断电导致重启失败, observer 服务启动时显示 缓存数据未初始化

[2024-11-13 17:28:32.654752] WDIAG [STORAGE.TRANS] stop (ob_time_wheel.cpp:427) [14957][observer][T0][Y0-0000000000000000-0-0] [lt=2][errcode=0]

ObTimeWheel is not inited

[2024-11-13 17:28:32.654760] WDIAG [STORAGE.TRANS] wait (ob_time_wheel.cpp:450) [14957][observer][T0][Y0-0000000000000000-0-0] [lt=7][errcode=0]

ObTimeWheel is not inited

[2024-11-13 17:28:32.654786] WDIAG begin (ob_hashtable.h:914) [14957][observer][T0][Y0-0000000000000000-0-0] [lt=2][errcode=-4006] hashtable not

init, backtrace=0x12435d5c 0x116204cc 0x11418847 0xfae7886 0x7f84348f6ce9 0x7f84348f6d37 0x7f84348df55c 0x52dde1e

[2024-11-13 17:28:32.654804] WDIAG begin (ob_hashtable.h:914) [14957][observer][T0][Y0-0000000000000000-0-0] [lt=5][errcode=-4006] hashtable not

init, backtrace=0x12435d5c 0x116204cc 0x11418847 0x11418489 0xfae7955 0x7f84348f6ce9 0x7f84348f6d37 0x7f84348df55c 0x52dde1e

[2024-11-13 17:28:32.654814] WDIAG [COMMON] deregister_cache (ob_kv_storecache.cpp:645) [14957][observer][T0][Y0-0000000000000000-0-0] [lt=4][er

rcode=-4006] The ObKVGlobalCache has not been inited, (ret=-4006)

[2024-11-13 17:28:32.657007] WDIAG [STORAGE.TRANS] stop (ob_time_wheel.cpp:427) [14957][observer][T0][Y0-0000000000000000-0-0] [lt=4][errcode=0]

ObTimeWheel is not inited

[2024-11-13 17:28:32.657019] WDIAG [STORAGE.TRANS] wait (ob_time_wheel.cpp:450) [14957][observer][T0][Y0-0000000000000000-0-0] [lt=12][errcode=0

] ObTimeWheel is not inited

obproxy 服务单独启动成功了。附件是 observer。log 的日志

【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

用户问题: “OCP 4.3.2 在测试环境中因断电导致重启失败,observer 服务启动时显示缓存数据未初始化,如何解决?”
推荐使用 obdiag 工具进行日志采集,并且将采集到的日志提供给我们以便确认问题所在。
日志采集场景: observer无故重启
日志采集命令: obdiag gather scene run --scene=observer.restart

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 断电前是否有正在进行的大规模操作或事务?
  2. 断电后尝试重启 observer 服务的具体步骤是什么?
  3. 是否有其他节点也出现了类似的问题?
  4. 当前使用的 OceanBase 版本号是多少?
  5. 可否提供 observer 启动失败时的详细错误日志?

更多信息请查看:

  1. 4000 ~ 4499
  2. 系统内存不足/泄漏
  3. 监控告警
  4. 重启 OBProxy 集群下全部 OBProxy
  5. SYS 租户/RS 服务问题

附上敏捷诊断工具 obdiag 使用帮助链接

1.确认下服务器时间是否同步,ob_time_wheel错误 通常和时钟跳变有关

2.麻烦确认下OB版本 进入OB安装目录bin下,./observer -V 以及发下observer.log
3.发下 obd.log
4.发下 ocp-server.log

这个问题有进展吗