恢复完租户后,删掉租户再次进行恢复报:OB_MACHINE_RESOURCE_NOT_ENOUGH(-4624)

【 使用环境 】测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】成功恢复完租户后,删掉租户再次进行恢复报错,等一段时间后再次执行恢复又正常,是否需要重置下资源的状态?
报错日志:
ALTER SYSTEM RESTORE haiyisec FROM ‘file:///hybackup/data,file:///hybackup/archive’ WITH ‘pool_list=haiyisec_pool&concurrency=100’;
ERROR 9099 (HY000): haiyisec restore failed, ROOTSERVICE : OB_MACHINE_RESOURCE_NOT_ENOUGH(-4624) on “172.25.95.2:2882” with traceid YB42AC195F02-00063CB310CFF8F7-0-0
【复现路径】

【附件及日志】

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

根据您的问题描述,看起来是在尝试恢复租户时遇到了资源不足的问题。这可能是因为机器上的资源不足以满足恢复操作的需求,比如内存、CPU或磁盘空间等。针对这种情况,我们可以通过obdiag工具来收集相关的信息,以便更深入地了解具体是哪方面的资源出现了不足。

日志采集场景: 内存问题 / CPU高 / clog盘满
由于资源不足问题可能由多种因素引起,这里我们推荐收集内存、CPU及clog盘的使用情况,您可以选择其中与您的具体情况最相关的场景进行日志采集。

日志采集命令:

  • obdiag gather scene run --scene=observer.memory
  • obdiag gather scene run --scene=observer.cpu_high
  • obdiag gather scene run --scene=observer.clog_disk_full

请先执行上述命令中的一个或多个,收集相关信息,并将生成的日志文件提供给我们进一步分析。

另外,为了确定具体的问题,在此需要您提供一些信息:

  1. 当前集群中各个节点的硬件配置情况如何?
  2. 尝试恢复租户时,是否还有其他租户正在进行大规模的操作?
  3. 在尝试恢复租户之前,是否有新增加了其他服务或应用在相同的机器上运行?
  4. 您可以提供恢复租户时的具体命令和参数吗?
  5. 有关于这个错误的详细日志信息吗?如果有,请一并提供。

附上敏捷诊断工具 obdiag 使用帮助链接

资源不足,检查一下你的集群所剩资源。select * from gv$ob_observers;

在做这个操作的时候没有其他任何操作,有点奇怪的是,强制删掉租户后,按理说已经释放资源了,删掉租户后1,2分钟 会有这个问题,过多几分钟 同样的操作又正常的,感觉应该是资源没有完全释放的问题?

应该是被删除的租户在回收站里,unit资源未完全释放。

操作太快了,之前的RESOURCE POOL还没释放。