OB备份clog问题

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】OB
【 使用版本 】OBCE-4.2.2
【问题描述】在ocp 上配置了租户的备份策略,默认会在 nfs 下面生成 data 、clog 两个目录,data 是静态数据,通过三方备份系统归档都正常,但是 clog 是 动态数据,一直有数据写入,三方专业的备份系统归档一直提示 文件在使用,无法备份。请问有什么方法可以 解决 这个问题吗。@论坛小助手

针对您在 OceanBase 4.2.2 版本中遇到的 clog 动态数据因持续写入而导致第三方备份系统无法归档的问题,我们可以使用 obdiag 工具来帮助您采集相关信息并进行初步分析。

根因分析场景:

在这种情况下,我们首先需要对 clog 盘满的情况进行根因分析,以了解 clog 日志为何未能被正常归档。

根因分析命令:

obdiag rca run --scene=clog_disk_full

日志采集场景:

同时,我们也需要采集与 clog 相关的基础信息,以便更全面地了解当前集群的状态。

日志采集命令:

obdiag gather scene run --scene=observer.clog_disk_full

解释:

  • 根因分析命令 (obdiag rca run --scene=clog_disk_full) 用于识别 clog 日志磁盘空间满的问题,这可以帮助我们理解为什么 clog 未能被第三方系统归档。
  • 日志采集命令 (obdiag gather scene run --scene=observer.clog_disk_full) 会收集与 clog 相关的日志和配置信息,这对于后续的故障排查非常关键。

提供更多信息:

为了更准确地定位问题,请您提供以下信息:

  1. 第三方备份系统的具体名称和版本是什么?
  2. 您是否观察到了 clog 日志文件的增长速度异常快?
  3. 是否有正在进行的大批量数据操作或长时间运行的事务?
  4. 您的 clog 磁盘空间配置是多少?是否已经接近上限?
  5. 在出现问题前后,是否有对集群进行过任何配置更改?如果有,请详细说明。

附上敏捷诊断工具 obdiag 使用帮助链接

意思是还需要用第三方再备份一次么

每个租户 一个单独的clog 目录,clog 不是 一直在变化的嘛,导致其他三方备份软件无法备份clog 。
这个clog 目录 有没有定时备份的,或者 能识别到 哪个子目录是已经生成完了的,我理解只要备份已经生成完了的clog 就没事,备份正在写入的clog 就有问题。

不是。现在nfs 空间有限,只能保存3~4天,我想把备份的数据归档到三方系统保存一个月。

我在ocp 盛设置备份策略,这个策略会自动备份clog 数据吗?我想知道 我如果只备份data 目录,如果想做增量还原,会不会有问题?

image

会有问题的,clog不能缺失

扩容下NFS空间呢,可以后续修改为7天备份清理周期就不需要操心了

这个归档写入是定时的吗?还是一直都在写入数据的?如果能识别 到 归档已写入完成的目录,我单备份这个目录也可以。

再向您确认几个问题:

  1. 您的备份策略是如何设置的?是否设置了具体的备份窗口期?
  2. 您提到希望识别已完成写入的clog子目录进行备份,请问您期望的最小粒度是多久一次的识别频率?
  3. 对于clog目录,您是否尝试过使用OCP或其他工具进行增量备份?效果如何?
  4. 您提到的第三方备份系统在处理其他类型的动态数据时是否存在同样的问题?

持续写入的

1、ocp 设置的是每天3:00 备份
2、最好是 1小时 归档一次,单独生成clog 时间戳的子目录。
3、clog 目前没有使用其他三方 备份工具,使用的是ocp 定时备份
4、目前使用veeam 备份动态数据出现了这个问题。

根据您的描述,您希望在不影响业务的情况下,能够定期(例如每小时)将已完成写入的 clog 子目录进行备份,并且您已经在 OCP 上配置了每天 3:00 的备份策略。您还提到使用 Veeam 这样的第三方备份工具遇到了问题,因为它无法正确处理正在写入的 clog 文件。

解决方案建议:

1. 使用 OCP 的备份功能

  • OCP 自动备份 clog 数据:OCP 默认的备份策略会同时备份 data 和 clog 数据。如果您已经在 OCP 上配置了每天 3:00 的备份策略,那么 clog 数据也会在这个时间点被备份。
  • 增量备份:如果您只备份 data 目录,而忽略 clog 目录,那么在进行增量恢复时可能会出现问题,因为 clog 包含了增量数据。为了确保数据的一致性和完整性,建议同时备份 data 和 clog。

2. 配置 OCP 的备份策略

  • 调整备份频率:您可以考虑调整 OCP 的备份策略,使其每小时进行一次备份,这样可以更好地匹配您的需求。请注意,频繁的备份可能会增加系统的负载。
  • 查看备份状态:您可以通过 OCP 的备份恢复页面来监控备份任务的状态,确保 clog 数据被正确备份。

3. 使用 Veeam 进行备份

  • Veeam 与 clog 的兼容性:由于 Veeam 在处理动态数据时存在问题,您可能需要联系 Veeam 的技术支持团队,询问他们是否有解决方案来处理正在写入的 clog 文件。
  • Veeam 的备份策略:如果 Veeam 支持增量备份,您可以考虑配置一个增量备份策略,仅备份自上次完全备份以来发生变化的数据。这可能会减少备份过程中对 clog 文件的影响。

4. 其他建议

  • 监控 clog 的增长情况:您可以定期检查 clog 目录的增长情况,确保有足够的磁盘空间来存储 clog 文件。
  • 优化 clog 的管理:如果 clog 文件的增长速度过快,您可能需要考虑优化应用程序的行为,减少不必要的事务操作,或者调整 OceanBase 的相关配置来优化 clog 的管理。

综上所述,建议您优先使用 OCP 的备份功能来备份 clog 数据,并根据需要调整备份策略。同时,您也可以考虑与 Veeam 的技术支持团队沟通,寻求更好的解决方案。

具体信息可参考以下文档:

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

这种能实现吗?类似oracle 的那种,定时备份归档,单独生成目录。

[论坛小助手] 是个近期投入的小机器人帮忙协助处理问题的 :joy:

你们的小助手 很专业 :grinning:

这就话 是不是 说 在ocp 在做增量备份的时候,clog 也备份进去了?

是的

有没有办法,让clog piece 一小时生成一次 ?
我这边是一天一个目录,如果这一天的clog归档 不成功,这一天的增量数据就没有了。

这边暂时没有找到相关方法