ocp创建集群第17步Do io bench失败,大佬给看看这个报错什么原因,执行1800s后就超时失败了

【 使用环境 】测试环境
【 OB or 其他组件 】企业版oceanbase3.2.4.1
【 使用版本 】
【问题描述】ocp创建集群第17步Do io bench失败,大佬给看看这个报错什么原因,执行1800s后就超时失败了
【复现路径】
2024-01-26 12:13:58.863 INFO 491 — [pool-manual-subtask-executor3,9dd7008fe4d0457e,82de1b79b586] c.a.o.s.task.util.AgentAsyncTaskHelper : try to request task result(EXECUTE), result:false,null,

672

673

2024-01-26 12:13:59.007 INFO 491 — [pool-manual-subtask-executor3,9dd7008fe4d0457e,82de1b79b586] com.alipay.ocp.common.pattern.Retry : wait for 15 seconds

674

675

2024-01-26 12:14:14.081 INFO 491 — [pool-manual-subtask-executor3,9dd7008fe4d0457e,82de1b79b586] c.o.o.e.internal.template.HttpTemplate : POST request to agent, url:http://192.168.61.133:62888/api/v1/task/status, request body:GetTaskStatusRequest(taskToken=f3790c7a-3c3c-4e55-9809-52a914e639bb), params:null

676

677

2024-01-26 12:14:14.255 INFO 491 — [pool-manual-subtask-executor3,9dd7008fe4d0457e,82de1b79b586] c.a.o.s.task.util.AgentAsyncTaskHelper : try to request task result(EXECUTE), result:false,null,

678

679

2024-01-26 12:14:14.390 INFO 491 — [pool-manual-subtask-executor3,9dd7008fe4d0457e,82de1b79b586] com.alipay.ocp.common.pattern.Retry : wait for 15 seconds

680

681

2024-01-26 12:14:29.669 INFO 491 — [pool-manual-subtask-executor3,9dd7008fe4d0457e,82de1b79b586] c.o.o.e.internal.template.HttpTemplate : POST request to agent, url:http://192.168.61.133:62888/api/v1/task/status, request body:GetTaskStatusRequest(taskToken=f3790c7a-3c3c-4e55-9809-52a914e639bb), params:null

682
subtask_2002744.log (200.5 KB)

【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(系统巡检和诊断信息收集)

如果你是测试环境,do io bench 测试可以跳过,这个比较耽误时间。不影响 OB 集群的创建。

io bench 跳过的逻辑:

  1. 先确保数据盘目录权限对(admin 用户对 /data/1 /data/log1 都有读写权限)。
  2. 到 /data/1 下看看是否生成了临时大文件,如果有删除那个跟 io bench 有关的文件。
  3. ocp 里跳过当前任务(设置为成功),然后继续下一个任务。

如果要查 io bench 失败的原因。先看看 ocp 发起 io bench 任务是否成功。在 OB 节点上看进程

ps -ef|grep bench
ps -ef|grep fio

以及看 /data/1 下是否有生成 io bench 相关的文件。
如果一点线索都没有,感觉就是 ocp 的任务下发环节出问题。
ocp里检查一下主机上的 agent是否正常等等。

你好,你提的这个技术问题牵涉到OceanBase企业版范围内的功能细节。建议你通过以下方式寻求帮助:
1.如你所在的企业客户已签署OceanBase企业版销售合同,请你联系客户经理;
2.如你所在的企业客户尚未签署OceanBase企业版销售合同,你可通过OceanBase官网商务咨询页面留下你的联系方式,OceanBase企业版的业务顾问会在一个工作日内与你联系。
OceanBase官网商务咨询

您好,有进程,/data/1 有生成100g文件


可以杀掉 进程,然后删除 文件 /data/1/obcp/bench_chunk
然后 ocp任务跳过继续。
如果看到 fio 进程,也杀掉,并删除 fio 生成的文件。

一般是因为磁盘性能比较差