FORCE STOP ZONE

FORCE STOP ZONE:
我们首选STOP ZONE命令隔离机房对应的Zone,但其他Zone内的节点的副本日志存在较大延迟,STOP ZONE命令无法执行成功。

这里的,副本日志存在较大延迟:
1 指的是“被隔离的zone内的节点副本的日志还没有同步到其他zone”?如果是这种情形,那zone被隔离后,被隔离的zone内的leader副本是在命令执行完的一段时间内才迁移到其他zone的嘛?应该不是立刻迁移的吧?

2 还是指的是“其他zone内的节点副本的日志还没有同步到被隔离的zone”?

这里的“副本存在较大延迟”指前者,因为这种情况可能会对系统可用性造成影响。另外,是否造成可用性影响也和后续的运维操作有关:

  1. 如果在FORCE STOP ZONE之后,目标Zone节点仍然继续参与Paxos日志同步,明确不会下线目标Zone节点,那么可以安全的使用FORCE STOP ZONE,实现隔离故障以及切换业务流量目的;
  2. 如果希望在FORCE STOP ZONE之后就下线目标节点,需要关注存在落后副本的日志流情况;