OceanBase的“三副本+多Zone”部署下,单Zone故障的自动恢复机制与数据同步延迟风险

内容描述:
当某个Zone因网络隔离或硬件故障整体不可用时,OceanBase如何自动触发主副本切换和数据补全?在恢复过程中,可能出现的数据同步延迟是否会导致业务读到旧数据?运维人员应如何监控__all_virtual_clog_stat 等系统表,并制定应急预案?希望探讨故障演练(Chaos Engineering)在OceanBase集群中的实践。