尝试重启observer失败

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

一开始是使用kill命令杀掉了observer进程,之后又尝试直接重启observer进程,结果启动不成功,相应的日志文件见 [https://upfile.live/zh-cn/files/8fd478e2]

6 个赞

根据您的描述,您在尝试使用kill命令终止observer进程后,无法成功重启observer进程。对于这种情况,我们可以首先通过obdiag工具来收集更详细的日志信息以帮助诊断问题的原因。这里主要涉及到的日志采集场景为“observer无故重启”。基于此,我将指导您如何使用obdiag工具进行相应的日志采集。

日志采集场景: observer无故重启
日志采集命令: obdiag gather scene run --scene=observer.restart

这条命令将帮助我们从系统中自动收集与Observer重启相关的关键信息,包括但不限于配置文件、运行时状态信息以及可能影响服务重启的其他重要数据。

由于您已经提供了一个链接指向了相关的日志文件([https://upfile.live/zh-cn/files/8fd478e2]),这非常有助于初步了解情况。但我还是建议按照上述方法使用obdiag执行一次新的日志收集任务,因为这样可以确保获取到的是最全面且最新的信息。请执行完上述命令后,将生成的日志压缩包发送给我们进一步分析。

为了让我们能够更加准确地定位并解决这个问题,请回答以下几个补充性的问题:

  1. 在执行kill命令前,是否存在明显的性能瓶颈或其他异常现象?如CPU使用率高、内存占用过高或磁盘I/O繁忙等。
  2. 执行kill操作的具体方式是什么样的?是直接使用了kill -9吗?如果是,则可能会导致部分资源未能正常释放从而影响后续启动。
  3. 当尝试重新启动observer时,是否观察到了任何具体的错误消息或警告信息?
  4. 观察者实例所在的主机环境是否有特殊配置?比如特殊的网络设置、防火墙规则或是操作系统级别的安全策略等。
  5. 最近是否对OceanBase集群做了配置变更或者软件升级?

期待收到更多的细节以便于深入分析。感谢您的配合!

附上敏捷诊断工具 obdiag 使用帮助链接

4 个赞

发一下从启动到失败时间的observer.log日志 日志信息不全

1 个赞

学习

2 个赞

学习学习

1 个赞

66666

1 个赞

给我店店站,xx

论坛小助手:写得真详细,收藏了。