observer莫名其妙挂掉

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】 社区版4.3
【问题描述】集群启动没一会3个节点observer会一个一个挂掉
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

https://ask.oceanbase.com/t/topic/35605619[trace.log|attachment]
observer.zip (3.8 MB)

  1. 可以先使用obdiag巡检和分析下三节点日志。看一看是什么情况导致的。
    obdiag文档:OceanBase分布式数据库-海量数据 笔笔算数
  2. 可以先把三节点的observer.log都提供下。配置文件最好也提供下。

从你提供的日志中并没有看到明显的错误提示,可以提供observer.log.wf.*/rootservice.log.wf.*相关日志吗?另外,您指的挂掉是observer core了吗,core也会有相关日志记录,但是您提供的日志中没有包含这些信息

一写数据就挂

observer.log.wf.zip (2.4 KB)

执行下这个看看集群资源
select a.zone, a.SVR_IP,a.SVR_PORT, b.status,cpu_capacity,cpu_assigned_max,cpu_capacity-cpu_assigned_max as cpu_free,round(memory_limit /1024/1024/1024 ,2) as memory_total_gb,round((memory_limit-mem_capacity) /1024/1024/1024 ,2) as system_memory_gb,round(mem_assigned /1024/1024/1024 ,2) as mem_assigned_gb,round((mem_capacity-mem_assigned) /1024/1024/1024 ,2) as memory_free_gb,round(log_disk_capacity /1024/1024/1024 ,2) as log_disk_capacity_gb,round(log_disk_assigned /1024/1024/1024 ,2) as log_disk_assigned_gb,round((log_disk_capacity-log_disk_assigned) /1024/1024/1024 ,2) as log_disk_free_gb,round((data_disk_capacity /1024/1024/1024 ),2) as data_disk_gb,round((data_disk_in_use /1024/1024/1024 ),2) as data_disk_used_gb,round((data_disk_capacity-data_disk_in_use) /1024/1024/1024 ,2) as data_disk_free_gb from gv$ob_servers a join oceanbase.DBA_OB_SERVERS b on a.zone=b.zone\G;

  1. 可以先使用obdiag巡检和日志分析下三节点日志。看一看是什么情况导致的。
    obdiag文档:OceanBase分布式数据库-海量数据 笔笔算数)看看。