observer 手动部署,启动几分钟后又自动退出了

改了不生效,提示修改成功了,但是优先级还是和之前一样


dao到拓扑图这里 把zone2的副本删除看看是否会报错

也不行

再帮忙看看故障节点的主机状态在ocp里面是否正常

主机状态看起来正常


这里报错地域内至少存在两副本,你看看可不可以把三个节点的地域调成一样的再删副本

调成相同地域后,可以删除副本了;
在OCP 上面重新安装该节点, 也是进程起来几分钟后就退出了


observer 日志如下
observer.log_02061128.tar.gz (4.0 MB)

下载ocp的任务日志发下

在Run io calibration 步骤超时了,这个时候 observer 进程已经退出了
subtask_16993.log (328.5 KB)

第一次失败时,出现Invalid argument时的任务日志麻烦下载发下

第一次超时失败后点击重试,就会出现Invalid argument
subtask_16993_151901.log (382.7 KB)

根据这个trace id:YB422F714F6B-00062BCFDEBC2E62-0-0
grep一下observer日志看看,你上面发的日志这边并未grep到相应日志

这个 trace id是要看ocp 相关的日志还是 observer 的日志呢

也可以用obdiag做一次 集群巡检 看看是否是部署的不规范

一键集群巡检

obdiag check run
–config db_host=xx.xx.xx.xx
–config db_port=xxxx
–config tenant_sys.user=root@sys
–config tenant_sys.password=***
–config obcluster.servers.global.ssh_username=test
–config obcluster.servers.global.ssh_password=******
–config obcluster.servers.global.home_path=/home/admin/oceanbase
–config obcluster.servers.nodes[1].data_dir=/home/admin/oceanbase/store
–config obcluster.servers.nodes[1].redo_dir=/home/admin/oceanbase/store
–config obproxy.servers.nodes[0].ip=xx.xx.xx.1
–config obproxy.servers.nodes[1].ip=xx.xx.xx.xx.2
–config obproxy.servers.global.ssh_username=test
–config obproxy.servers.global.ssh_password=******
–config obproxy.servers.global.home_path=/home/admin/obproxy
https://www.oceanbase.com/docs/common-obdiag-cn-1000000002200479

需要查看observer的日志