ocp安装1-1-1的集群,机械磁盘,卡在Run io calibration

【 使用环境 】 测试环境
【 OB or 其他组件 】ocp
【 使用版本 】ocp-4.3.0-20240617185317 部署 ob-4.3.2.0
【问题描述】任务卡在卡在Run io calibration,重试+回滚+在重建都没法通过
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

2024-08-06 14:36:53.062 INFO 33652 — [pool-manual-subtask-executor16,0bc223374f19447a,afc43da9679e] c.o.o.s.o.o.f.ConnectPropertiesBuilder : get credential from obsdk context, clusterName=ob01, tenantName=sys, dbUser=root

2024-08-06 14:36:53.103 INFO 33652 — [pool-manual-subtask-executor16,0bc223374f19447a,afc43da9679e] c.o.ocp.obsdk.connector.ConnectTemplate : [obsdk] sql: set ob_query_timeout = ?, args: [10000000]

2024-08-06 14:36:53.128 INFO 33652 — [pool-manual-subtask->executor16,0bc223374f19447a,afc43da9679e] c.o.ocp.obsdk.connector.ConnectTemplate : [obsdk] sql: SELECT svr_ip, svr_port, storage_name, status, start_time, finish_time FROM GV$OB_IO_CALIBRATION_STATUS WHERE svr_ip = ? AND svr_port = ?, args: [192.168.6.156, 2882]

2024-08-06 14:36:53.163 INFO 33652 — [pool-manual-subtask-executor16,0bc223374f19447a,afc43da9679e] c.o.ocp.common.lang.pattern.Retry : wait for 5 seconds

一直重复以上日志,截图如下:
image

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

1 个赞

你的机械盘分区的类型是ext3、ext4、xfs的哪一个?

1 个赞

xfs的,用的旧服务器上的虚拟机。给了32C64G,600G磁盘
/dev/vda1 on / type xfs (rw,relatime,attr2,inode64,logbufs=8,logbsize=32k,noquota)

1 个赞

磁盘检验不过去 建议使用ssd磁盘 你把observer.log的日志发一下

1 个赞

我跳过这任务了,手动指定得ALTER SYSTEM REFRESH IO CALIBRATION STORAGE = ‘DATA’ CALIBRATION_INFO = (“read:4K:5ms:2000”,“write:2M:2ms:500”);

这个observer.log刷太快了,现在都120M了

1 个赞

手动校准 能过去么?主要还是磁盘校验不过 如果能跳过去的可以暂时跳过去

1 个赞

手动校准过不去,我执行ALTER SYSTEM REFRESH IO CALIBRATION STORAGE = ‘DATA’ CALIBRATION_INFO = (“read:4K:5ms:2000”,“write:2M:2ms:500”);后,重试任务,还是失败得。然后我社区看到说可以跳过,我这是测试环境,就直接跳过了。然后再最后创建资源计划那报错,我把这个手动校准得值设置大一点,点击重试又通过了

1 个赞

对磁盘的是有要求的 如果是测试的话 可以暂时测试 如果是生产环境想用的话 建议是ssd盘 数据盘和日志盘分开

1 个赞

:handshake:好的,感谢 :grinning:

1 个赞

如果问题已经解决 请劳烦点一下采纳 谢谢