为备租户创建日志归档 archivelog ,状态始终处于beginning 状态

【 使用环境 】测试环境

【 OB or 其他组件 】数据库sys租户用户操作,OCP中都试过

【 使用版本 】4.2.1.0

【问题描述】测试Switchover主备切换,使用物理备份恢复的备租户,为备租户创建日志归档,状态一直卡在beginning。环境为3副本集群,集群内主机都能访问到nfs,且开启归档后,在nfs文件夹中已经生成了部分文件,nfs分区中存储足够,还有200G。主租户能正常归档,归档存储路径都在同一个nfs中。请问如何排查该问题

【复现路径】为主租户创建日志归档-为主租户创建备份-恢复物理备份创建了备租户-为备租户创建日志归档

查询日志归档记录如下:

obclient [(none)]> SELECT * FROM oceanbase.CDB_OB_ARCHIVELOG;

TENANT_ID DEST_ID ROUND_ID INCARNATION DEST_NO STATUS START_SCN START_SCN_DISPLAY CHECKPOINT_SCN CHECKPOINT_SCN_DISPLAY COMPATIBLE BASE_PIECE_ID USED_PIECE_ID PIECE_SWITCH_INTERVAL UNIT_SIZE COMPRESSION INPUT_BYTES INPUT_BYTES_DISPLAY OUTPUT_BYTES OUTPUT_BYTES_DISPLAY COMPRESSION_RATIO DELETED_INPUT_BYTES DELETED_INPUT_BYTES_DISPLAY DELETED_OUTPUT_BYTES DELETED_OUTPUT_BYTES_DISPLAY COMMENT PATH
1002 1003 2 1 0 DOING 1708507226044878536 2024-02-21 17:20:26.044878 1708508667225953697 2024-02-21 17:44:27.225953 1 2 2 86400000000 1 none 89165722 85.04MB 173340810 165.31MB 1.94 0 0.00MB 0 0.00MB file:///data/nfs_new/archive/mysql_001
1010 1003 3 1 0 BEGINNING 1708505790089285060 2024-02-21 16:56:30.089285 1708505790089285060 2024-02-21 16:56:30.089285 1 3 3 86400000000 1 none 0 0.00MB 162424538 154.90MB 0.00 0 0.00MB 0 0.00MB file:///data/nfs_new/mysql_001_standby/obdemo/10001/tenant_incarnation_1/1010/clog

obclient [(none)]> SELECT * FROM oceanbase.CDB_OB_ARCHIVELOG_PIECE_FILES where piece_id = 3;

TENANT_ID DEST_ID ROUND_ID PIECE_ID INCARNATION DEST_NO STATUS START_SCN START_SCN_DISPLAY CHECKPOINT_SCN CHECKPOINT_SCN_DISPLAY MAX_SCN END_SCN END_SCN_DISPLAY COMPATIBLE UNIT_SIZE COMPRESSION INPUT_BYTES INPUT_BYTES_DISPLAY OUTPUT_BYTES OUTPUT_BYTES_DISPLAY COMPRESSION_RATIO FILE_STATUS PATH
1010 1003 3 3 1 0 ACTIVE 1708505790089285060 2024-02-21 16:56:30.089285 1708505790089285060 2024-02-21 16:56:30.089285 1708505790089285060 1708592190089285060 2024-02-22 16:56:30.089285 1 1 none 0 0.00MB 0 0.00MB 0.00 INCOMPLETE file:///data/nfs_new/mysql_001_standby/obdemo/10001/tenant_incarnation_1/1010/clog

故障排查没思路的情况下,强烈建议用obdiag来帮你。

可以用obdiag 先分析一下ob的日志,如果记得准确一点的为用户创建日志归档的时间的话,指定一下时间范围分析的日志能少一点,比如:obdiag analyze log --from 2024-02-21 10:25:00 --to 2024-02-21 11:30:00

我今天遇到了同样的问题,是nfs配置的问题,/etc/exports文件ip后面多了个空格,导致该目录是只读,修改后重启nfs服务目录权限恢复正常,归档状态也变成doing