在已部署ocp服务器上,部署业务集群,observer 端口进行的差异配置,集群初始化失败,放弃任务后ocp会不可用

【 使用环境 】
准生产环境

【 ocp 】
【 使用版本 】
image

【问题描述】
背景:
生产环境服务器资源不太足,想要确认是否能在已部署ocp的服务器上安装业务集群,因此在准生产环境中,在已部署ocp服务器上创建集群。

集群创建失败:

observer的端口都进行了调整

放弃任务后页面会提示如下错误:

手工启动observer,页面恢复

问题:
1、ocp上安装业务集群时,ob的安装目录以及端口都改了,为什么不能安装业务集群,是同一台服务器上不支持部署多个 observer吗
2、我如何能将失败任务 给放弃掉

2 个赞

1.OCP还不支持同一台服务器上部署多个observer,除了修改SQL端口,RPC端口,还有obshell端口以及OCP自己的一些端口

2.你说的“放弃任务后页面会提示如下错误” 是指任务回滚后 出现了异常吗?

2 个赞

如果2是这种情况,麻烦发下ocp-server.log

1 个赞

ocp-server.zip (7.8 MB)

1 个赞

是的,任务回滚

1 个赞

有什么处理方法吗

正常的任务回滚是不会出现的异常的,由于OCP不支持同一台服务器上部署多个 observer,但是也没有做拦截,
你使用OCP在ocp meta数据库服务器上部署另外一个observer 这是一个非标操作,产生了影响。

有没有办法处理这种问题

连接ocp_meta租户的meta_database数据库,将这个任务及子任务修改为成功

begin; update task_instance set state='SUCCESSFUL' where id=xxx   --填写任务ID
;update subtask_instance set state='SUCCESSFUL' where id=xxx;  --填写子任务ID
commit;

在ocp这台服务器上直连ob,数据库中没有找到 intance相关表

obclient -hxx.xx.xx.xx -P2881 -uroot@ocp_meta -p'xxxx' -Dmeta_database -A


修改元数据库以后任务状态是变化了,但是集群状态还是处于创建中,我如何能够清楚残留的集群信息

这种情况将主任务置为失败试下,到概览页面看下,应该没有这个创建失败的集群的信息了,或者将主任务和所有子任务都置为失败


当前任务状态是这样的,并且按照之前你给的方式,将主任务、失败的子任务设置成功以后,后面的子任务也没有开始执行,貌似没办法设置后续子任务的状态

嗯,设置成功应该不可以,任务还会继续下一步,直接设置成失败吧

update的字段值是 fail 还是 failed

FAILED

begin;
update task_instance set state=‘FAILED’ where id=1611137;
update subtask_instance set state=‘FAILED’ where id=1629225;
commit;

是这样吗

将主任务置为失败看下

begin;
update task_instance set state='FAILED' where id=1611137;
commit;