物理备份,全量备份偶尔会失败,报错:-9027(ob log archive interrupted)

【使用环境 】 测试环境
【 OB or 其他组件 】
【 使用版本 】oceanbase-ce-4.3.5.1
【问题描述】物理备份,全量备份偶尔会失败,报错:-9027(ob log archive interrupted),为什么会出现这种报错呢?我是用的磁盘是机械盘,是和磁盘有关吗?
【重新步骤】
– 全量备份
ALTER SYSTEM BACKUP TENANT = ‘haiyisec’ PLUS ARCHIVELOG;

1 个赞

有可能和磁盘有关,备份带宽最低要求6MB,机械盘压力大时io队列较长 会有问题,可以根据traceid取下 rootservice.log和observer.log上传下

3 个赞

只有这个,麻烦看看
grep “YB427F000001-000642BF890ACCB5-0-0” rootservice.log
rootservice.log (24.0 KB)

3 个赞

看了下这个日志,只能说明备份失败是由于归档断流导致的,看不到归档断流的具体原因,查下这个看下

select * from __all_server_event_history where event like '%mark_fatal_error%' order by gmt_create desc limit 30;

以及
select * from __all_rootservice_event_history where module like '%archive%' order by gmt_create desc limit 30;

归档断流时间的rootservice.log和observer.log有吗

2 个赞

学习总结经验 :+1:

2 个赞

日志太多了,怎么找到对应的日志呢?

2 个赞

这个时间前后5分钟的日志

2 个赞


大概是当时磁盘压力过大(util90%以上)或者性能抖动

1 个赞

rootservice.log (23.8 MB)

1 个赞

检查下clog盘空间是否满了,如果空间没满 应该是磁盘负载高导致hung了

[2025-11-04 15:39:03.668267] WDIAG [STORAGE.TRANS] get_gts (ob_gts_source.cpp:223) [514][T1001_ArchiveSv][T1002][YB427F000001-000642BF892ACC92-0-0] [lt=1][errcode=-4023] get_gts_from_local_timestamp_service fail(leader="127.0.0.1:2882", server="127.0.0.1:2882", tmp_ret=-4038)
[2025-11-04 15:39:03.718360] WDIAG [STORAGE.TRANS] get_gts (ob_gts_source.cpp:223) [514][T1001_ArchiveSv][T1002][YB427F000001-000642BF892ACC92-0-0] [lt=4][errcode=-4023] get_gts_from_local_timestamp_service fail(leader="127.0.0.1:2882", server="127.0.0.1:2882", tmp_ret=-4038)
[2025-11-04 15:39:03.763309] WDIAG [STORAGE.TRANS] get_gts (ob_gts_source.cpp:223) [514][T1001_ArchiveSv][T1002][YB427F000001-000642BF892ACC92-0-0] [lt=3][errcode=-4023] get_gts_from_local_timestamp_service fail(leader="127.0.0.1:2882", server="127.0.0.1:2882", tmp_ret=-4038)
[2025-11-04 15:39:03.763360] INFO  [STORAGE.TRANS] refresh_gts_location_ (ob_gts_source.cpp:574) [514][T1001_ArchiveSv][T1002][YB427F000001-000642BF892ACC92-0-0] [lt=41] gts nonblock renew success(ret=0, tenant_id=1002, gts_local_cache={srr:[mts=1762241935007639], gts:1762241934966722000, latest_srr:[mts=1762241943631666]})
[2025-11-04 15:39:03.800926] WDIAG [RS] update_tenant_service_epoch_ (ob_disaster_recovery_service.cpp:451) [515][T1001_DRService][T1001][YB427F000001-000642BF908ACD01-0-0] [lt=10][errcode=-4392] fail to update service epoch(ret=-4392, ret="OB_DISK_HUNG", tenant_id=1001, proposal_id=266)
[2025-11-04 15:39:03.800934] WDIAG [RS] check_and_update_service_epoch_ (ob_disaster_recovery_service.cpp:391) [515][T1001_DRService][T1001][YB427F000001-000642BF908ACD01-0-0] [lt=7][errcode=-4392] fail to update service epoch(ret=-4392, ret="OB_DISK_HUNG", proposal_id=266)
[2025-11-04 15:39:03.801503] WDIAG [RS] do_dr_service_work_ (ob_disaster_recovery_service.cpp:111) [515][T1001_DRService][T1001][YB427F000001-000642BF908ACD01-0-0] [lt=11][errcode=-4392] fail to check and update service epoch(ret=-4392, ret="OB_DISK_HUNG")
1 个赞

应该磁盘不给力,不该用机械盘,至少得固态吧

2 个赞

学习了

磁盘也是影响的一个因素