cm库挂掉,应该如何排查?

@论坛小助手 初步判断是因磁盘空间不足

1 个赞

日志采集场景: 磁盘空间满
日志采集命令: obdiag gather scene run --scene=observer.clog_disk_full

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 当前集群的磁盘使用情况如何?是否已经清理过部分数据或日志?
  2. 是否有定期监控和告警机制来提前发现磁盘空间不足的问题?
  3. 您提到的是“cm”库,请问具体是哪个租户或者哪个数据库实例遇到了问题?
  4. 磁盘空间不足时,是否有特定的操作(如大事务、大量写入)导致空间迅速耗尽?

请使用上述 obdiag 命令进行日志采集,并将生成的日志压缩包提供给我们以便进一步分析。

附上敏捷诊断工具 obdiag 使用帮助链接

2 个赞

cm库是什么,日志收集一下

当前环境还存在么

保存oms状态信息的数据库

已经重新手动拉起cm库了

根据文档库中的信息,OMS 社区版的状态信息通常保存在其元数据库(meta 库)中。以下是关于 OMS 社区版元数据库的相关说明:

  1. 元数据库的作用
    OMS 社区版的元数据库(meta 库)用于存储 OMS 的配置、任务状态、迁移进度等重要信息。如果该数据库出现问题,可能会影响 OMS 的正常运行。

  2. 元数据库的名称
    根据文档片段 3 中的信息,在升级或回滚操作时,OMS 社区版的新容器仍然会使用旧的元数据库(例如 db_oms)。因此,OMS 社区版的状态信息通常保存在名为 db_oms 或类似的数据库中。

  3. 如何确认元数据库名称
    如果您不确定具体的元数据库名称,可以通过以下步骤确认:

    • 登录到 OMS 社区版所在的容器。
    • 连接到 MySQL 数据库(或其他支持的数据库),执行以下命令查看数据库列表:
      SHOW DATABASES;
      
    • 找到与 OMS 相关的数据库,通常命名为 db_oms 或其他类似的名称。
  4. 关于 CM 库的恢复
    您提到已经重新手动拉起了 CM 库。如果 CM 库是 OMS 社区版的元数据库的一部分,请确保 CM 库的数据完整性和一致性。如果 CM 库的数据丢失或损坏,可能需要从备份中恢复。参考文档片段 3 的建议,您可以使用备份工具(如 mysqldump)导出并恢复数据库。

  5. 高可用功能的影响
    根据文档片段 5 和 9 的信息,如果您启用了 OMS 社区版的高可用(HA)功能,系统可能会自动容灾 Store,并尝试恢复增量同步(Incr-Sync)和全量导入(Full-Import)组件。请检查以下参数是否正确配置:

    • ha.config 参数中的 enable 是否设置为 true
    • 回拉时间参数 refetchStoreIntervalMin 是否合理设置。

如果仍有问题,请提供更多上下文信息,例如:

  • OMS 社区版的具体版本号。
  • 元数据库的实际名称。
  • 是否有相关的错误日志或异常提示。

希望以上信息能够帮助您解决问题!

更多信息请查看:

  1. 常见问题
  2. OMS 社区版问题排查手册
  3. 概述
  4. 启动和暂停数据迁移任务
  5. 通过 OMS 进行数据迁移和同步
  6. 运维 Supervisor 组件
  7. JDBC-Sink
  8. StoreSource
  9. 单节点升级
  10. 部署类型

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)