【 使用环境 】生产环境
【 OB or 其他组件 】ob4.1,ocp4.0.3
【问题描述】
ocp观察告警日志显示有个机器ob服务检测不到了,然后想通过重启修复,发现重启observers任务失败。之后尝试执行zone重启,任务失败,卡在这了,任务放弃也不行,执行也执行不了。
这个要怎么处理那?
麻烦提供下完整ocp日志呢。
Failed to connect obproxy server, maybe caused by odp process down, wrong password, or ocp address not in private ip list and odp parameter skip_proxy_sys_private_check is not true
检查下[133.197.204.3:2883]的opb是否可以连接。
有改过proxy密码嘛?
没改过
我们现在是单节点出现问题,也需要巡检集群吗?
看着是133.197.204.3的obproxy服务也挂了,可以ocp上先把obproxy拉起来。再试试
好的
设置为成功 看下。
ocp上面没这个操作,是alter操作?
哦哦,没发现
先把整个任务回退或跳过,再确认下observer.log日志是否有启动异常信息。
在ocp已经拉起来了133.197.204.3的obproxy后新起的任务,想重启observer。
observer.log的日志是集群的吗?还是报错机器所在的?
要重启集群的这个节点的observer.log日志