oceanbase数据库运行过程中删除日志的处理

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】OceanBase数据库运行一段时间了,发现磁盘满了,然后运维直接将日志给删除了,导致数据库停止了,在启动也启动不起来怎么处理
【 使用版本 】4.3.3
【问题描述】OceanBase数据库运行一段时间了,发现磁盘满了,然后运维直接将日志给删除了,导致数据库停止了,在启动也启动不起来怎么处理
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

日志采集场景: 集群无法连接
日志采集命令: obdiag gather scene run --scene=observer.cluster_down
日志采集场景: clog盘满
日志采集命令: obdiag gather scene run --scene=observer.clog_disk_full

推荐使用 obdiag 工具进行日志采集,并且将采集到的日志提供给我们以便确认问题所在。从您的描述来看,OceanBase 数据库由于磁盘空间满了并且删除了日志后无法启动,这可能涉及到clog盘满以及集群无法正常启动的问题。

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 在删除日志之前是否有任何警告或错误信息?如果有,请提供具体的错误信息。
  2. 您能否提供删除日志的具体操作步骤?
  3. 系统当前的磁盘使用情况如何?请提供各分区的磁盘使用率。
  4. 是否尝试过重启 OceanBase 服务?如果有,请描述重启后的现象。
  5. 是否有其他相关配置文件被修改过?如果有,请提供修改内容。

附上敏捷诊断工具 obdiag 使用帮助链接

日志文件,clog日志吗,还是observer的运行日志

1 个赞

山运行日志observer.log目录下的日志无所谓,但删除clog的话,看架构了~~

你好,提供下,集群版本、集群架构,从现象来看是删除了/data/log1里的日志吗