【 使用环境 】生产环境
【 OB or 其他组件 】ocp
【 使用版本 】
【问题描述】
社区版本ocp添加主机后,频繁报clockdiff不通过
已经尝试配置了时钟同步,已经试过执行过setcap ‘cap_sys_nice,cap_net_raw+ep’ “$(which clockdiff)”
都不行,然后尝试跳过后,添加成功,但是在做主机标准化的时候,任务里的子任务部分出现警告状态,然后任务是成功的,但是会检测很多黄色警告项,ocp那里看到的主机也不是绿色
【复现路径】
log_task_2000032.zip (14.0 KB)
麻烦发下OCP版本及OBserver版本
ocp版本是4.2.2,metadb集群的observer版本是4.2.1.2
从日志看clock offset检查是成功的,其它一些操作系统的内核参数检查不符合要求 自动修复失败了,
可以先参考这个手动调整下内核参数及安装下libatomic包,fio包
https://www.oceanbase.com/docs/common-ocp-1000000002380721
OCP4.2.2版本比较旧了,是存在自动修复失败的bug的,建议升级下OCP版本
是这样的,ocp添加主机的第一步检查clockdiff的时候,都是失败的,偏移时间大概100ms误差的样子,clockdiff -o ocp主机ip是down状态,但是网络都是通的,chrony服务同步都是正常的,另外也尝试过chronyc -a makestep强同步始终没办法降低误差到50ms以内,所以我这边选择了跳过任务,然后能正常添加成功主机,所以在做主机标准化的时候,出现很多黄色告警项,请问下可以继续安装集群么?
libatomic和fio包这两个包已经手工安装了
麻烦参考这个手工配置下 sysctl.conf和 limits.conf,应该就可以了,clock offset我看检查已经通过了,说明时间偏移符合要求
https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002016079
https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002016077
OCP建议升级到最新版本
好的,谢谢