cubt
2025 年4 月 10 日 14:49
#1
【 使用环境 】
准生产环境
【 ocp 】
【 使用版本 】
【问题描述】
背景:
生产环境服务器资源不太足,想要确认是否能在已部署ocp的服务器上安装业务集群,因此在准生产环境中,在已部署ocp服务器上创建集群。
集群创建失败:
observer的端口都进行了调整
放弃任务后页面会提示如下错误:
手工启动observer,页面恢复
问题:
1、ocp上安装业务集群时,ob的安装目录以及端口都改了,为什么不能安装业务集群,是同一台服务器上不支持部署多个 observer吗
2、我如何能将失败任务 给放弃掉
2 个赞
旭辉
2025 年4 月 10 日 15:58
#4
1.OCP还不支持同一台服务器上部署多个observer,除了修改SQL端口,RPC端口,还有obshell端口以及OCP自己的一些端口
2.你说的“放弃任务后页面会提示如下错误” 是指任务回滚后 出现了异常吗?
2 个赞
旭辉
2025 年4 月 10 日 16:00
#5
如果2是这种情况,麻烦发下ocp-server.log
1 个赞
旭辉
2025 年4 月 11 日 15:30
#11
正常的任务回滚是不会出现的异常的,由于OCP不支持同一台服务器上部署多个 observer,但是也没有做拦截,
你使用OCP在ocp meta数据库服务器上部署另外一个observer 这是一个非标操作,产生了影响。
旭辉
2025 年4 月 11 日 16:31
#13
连接ocp_meta租户的meta_database数据库,将这个任务及子任务修改为成功
begin; update task_instance set state='SUCCESSFUL' where id=xxx --填写任务ID
;update subtask_instance set state='SUCCESSFUL' where id=xxx; --填写子任务ID
commit;
cubt
2025 年4 月 15 日 14:56
#15
在ocp这台服务器上直连ob,数据库中没有找到 intance相关表
旭辉
2025 年4 月 15 日 15:58
#16
obclient -hxx.xx.xx.xx -P2881 -uroot@ocp_meta -p'xxxx' -Dmeta_database -A
cubt
2025 年4 月 15 日 17:04
#17
修改元数据库以后任务状态是变化了,但是集群状态还是处于创建中,我如何能够清楚残留的集群信息
旭辉
2025 年4 月 15 日 17:19
#18
这种情况将主任务置为失败试下,到概览页面看下,应该没有这个创建失败的集群的信息了,或者将主任务和所有子任务都置为失败
cubt
2025 年4 月 15 日 17:24
#19
当前任务状态是这样的,并且按照之前你给的方式,将主任务、失败的子任务设置成功以后,后面的子任务也没有开始执行,貌似没办法设置后续子任务的状态
旭辉
2025 年4 月 15 日 17:28
#20
嗯,设置成功应该不可以,任务还会继续下一步,直接设置成失败吧
cubt
2025 年4 月 15 日 17:29
#21
update的字段值是 fail 还是 failed
cubt
2025 年4 月 15 日 17:34
#23
begin;
update task_instance set state=‘FAILED’ where id=1611137;
update subtask_instance set state=‘FAILED’ where id=1629225;
commit;
是这样吗
旭辉
2025 年4 月 15 日 17:37
#24
将主任务置为失败看下
begin;
update task_instance set state='FAILED' where id=1611137;
commit;