启动归档日志后,刚开始正常备份,10秒后断流

【 使用环境 】测试环境
【 OB or 其他组件 】OB
【 使用版本 】3.1.3-OceanBase CE
【问题描述】启动归档日志后,刚开始正常备份,10秒后断流
【复现路径】alter system set backup_dest=‘file:///home/nfs_server/backup’;
alter system archivelog;
【问题现象及影响】

【附件】
[2022-12-15 10:23:08.687171] ERROR [RS] do_schedule_ (ob_log_archive_scheduler.cpp:1187) [5328][208][YF2A0A0B900B-0005EFD467420F5F] [lt=140] [dc=0] [LOG_ARCHIVE] log archive status is interrupted, need manual process(sys_info={status:{tenant_id:1, copy_id:0, start_ts:1671070878595931, checkpoint_ts:1671070878595931, status:5, incarnation:1, round:3, status_str:“INTERRUPTED”, is_mark_deleted:false, is_mount_file_created:true, compatible:1, backup_piece_id:0, start_piece_id:0}, backup_dest:“file:///home/nfs_server/backup”}) BACKTRACE:0x99be10e 0x9793491 0x2273374 0x2272e5b 0x2272bc1 0x3829e5c 0x7033165 0x7031e3b 0x66bca22 0x994e80d 0x994e23e 0x3385bef 0x2c70eb2 0x9746965 0x9745692 0x974214f

先参考排查下:【SOP 系列 10】物理备份恢复问题排查相关

问题原因1:nfs客户端配置错误。错将/home/nfs 目录在nfs服务器执行挂载。
问题1解决方案:在nfs客户端(observer节点)先创建一个本地/home/nfs 目录,然后在nfs客户端执行挂载
[root@ob2 home]# mount -tnfs4 -o rw,timeo=30,wsize=1048576,rsize=1048576,namlen=512,sync {nfs服务器ip}:/home/nfs_server /home/nfs

nfs客户端配置正确后,status状态不再出现INTERRUPTED,而是BEGINNING。
问题原因2:nfs服务器目录权限不够。
在nfs客户端backup目录创建文件,发现权限不够。
[root@ob2 backup]# touch 11
touch: cannot touch ‘11’: Permission denied
[root@ob2 backup]# su admin
[admin@ob2 backup]$ touch 11
touch: cannot touch ‘11’: Permission denied
问题2解决方案:将nfs服务器上backup目录修改属组nfsnobody:nfsnobody。可以正常备份了。
[root@ob1 nfs_server]# chown -R nfsnobody:nfsnobody backup/
[root@ob1 backup]# ll
total 0
drwxr-xr-x 3 nfsnobody nfsnobody 16 Dec 15 11:56 obcluster
查看nfs客户端,发现备份正常。
[root@ob2 incarnation_1]# ll
total 12
drwx------ 3 nfsnobody nfsnobody 18 Dec 15 11:56 1
drwxrwxrwx 2 nfsnobody nfsnobody 87 Dec 15 11:56 clog_info
-rw------- 1 nfsnobody nfsnobody 123 Dec 15 11:56 cluster_backup_piece_info
-rw------- 1 nfsnobody nfsnobody 86 Dec 15 11:59 cluster_clog_backup_info
-rw------- 1 nfsnobody nfsnobody 85 Dec 15 11:56 tenant_name_info
[root@ob2 incarnation_1]# pwd
/home/nfs/backup/obcluster/10/incarnation_1
将nfs服务器上backup目录授权正确后,status状态不再出现BEGINNING,而是DOING。