OB磁盘静默检测机制

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】在官网上看到OB具备磁盘静默检测机制。由 builtin_db_data_verify_cycle参数控制。默认20天。这个对性能会有较大影响吗。当检测发现某个数据块异常时会进入到什么逻辑下?运维工程师需要怎么感知和干预呢?
【复现路径】
【附件及日志】

1 个赞

@论坛小助手

1 个赞

OceanBase具备磁盘静默检测机制,通过参数builtin_db_data_verify_cycle来控制,单位为天,默认值为20天,意味着每20天会自动检测一次数据的完整性。此参数的设置对于性能的影响较小,但在某些极端情况下,如存储大量冷数据且磁盘I/O压力较大时,可能会产生轻微的性能波动。
当检测发现某个数据块异常时,OceanBase会采取以下措施:

  1. 如果是热数据,系统会立即触发修复流程,从其他正常的副本中恢复数据。
  2. 如果是冷数据,系统会在定期检测过程中发现并记录错误,之后通过冷备机制恢复数据。
    运维工程师可以通过系统日志和报警信息来感知异常情况,并进行干预。建议定期查看系统日志,关注磁盘健康状况和数据校验结果,确保数据的完整性和一致性。

更多信息请查看:

  1. 发现磁盘的静默错误
  2. 数据保护概述
  3. builtin_db_data_verify_cycle
1 个赞

通过冷备机制恢复数据是什么意思?通过副本机制自动恢复数据么?

如果是由于磁盘故障引起的呢,无法立即恢复怎么办?系统会记录这个事件,并等待磁盘恢复后再自动恢复数据?

在整个过程中,需要人为干预的步骤有哪些

好问题,一直没有关注过这个问题