松松
#1
【 使用环境 】 测试环境
【 OB or 其他组件 】OBD、备份
【 使用版本 】5.7.25-OceanBase-v4.3.5.3 ;obd --version 为 OceanBase Deploy: 3.4.0
【问题描述】使用obd安装集群并创建租户后,进行一次备份恢复成功,再进行一次备份恢复后报错无可用CPU,查看top发现observer占了3个CPU
【复现路径】使用obd安装集群并创建租户后,进行一次备份恢复成功,再进行一次备份恢复后报错无可用CPU
查看top发现observer占了3个CPU,top -p pid -H查看是T1042_TimerWK2和T1040_TimerWK0主要占用
@论坛小助手
3 个赞
论坛小助手
#3
根据您的描述,OceanBase在使用obd工具进行备份恢复后遇到CPU占用率异常高,并且在第二次尝试备份恢复时失败并提示无可用CPU资源的问题。这可能是由于备份恢复过程中消耗了过多的CPU资源导致的。为了更好地诊断这个问题,我们推荐您使用obdiag工具来收集相关日志和执行根因分析。
推荐操作
根因分析场景: CPU高
根因分析命令: obdiag rca run --scene=observer.cpu_high
日志采集场景: 合并问题、CPU高
日志采集命令:
obdiag gather scene run --scene=observer.compaction
obdiag gather scene run --scene=observer.cpu_high
- 这些命令将分别收集与合并操作和CPU高相关的日志信息。
请运行上述命令,并将得到的日志文件打包后提供给我们,以便进一步分析问题所在。
需要额外提供的信息
为了更精确地定位问题,请您回答以下问题:
- 在执行备份恢复之前,系统是否已经处于较高的CPU负载状态?如果可以,请提供执行备份恢复前后的系统监控数据。
- 备份恢复过程中是否有其他大型操作(如大规模数据导入/导出)同时进行?
- 能否分享有关
T1042_TimerWK2和T1040_TimerWK0线程的具体职责或文档链接?这有助于理解为什么这些特定线程的CPU使用率会变得非常高。
- 您使用的OceanBase版本是多少?以及备份恢复期间涉及的数据量大约有多少?
期待您的回复及提供的日志文件,我们将尽快协助解决此问题。
附上敏捷诊断工具 obdiag 使用帮助链接
1 个赞
淇铭
#5
你好,你提的这个技术问题牵涉到OceanBase企业版范围内的功能细节;针对此类问题,建议你通过以下方式寻求帮助:
-
如你所在的企业客户已签署OceanBase企业版销售合同,请你联系客户经理;
-
如你所在的企业客户尚未签署OceanBase企业版销售合同,你可通过OceanBase官网商务咨询页面留下你的联系方式,OceanBase企业版的业务顾问会在一个工作日内与你联系。
另外,我们欢迎你使用社区版,并在论坛/社群中分享你对社区版本的想法、经验和问题,与其他社区成员共同交流。