集群重启后ocp-express起不来

【 使用环境 】生产环境
【 OB or 其他组件 】ocp-express
【 使用版本 】4.3
【问题描述】
image
一直卡在start ocp-express,但是数据库已经可以连了就是 ocp-express起不来

1 个赞

可以看下obd日志(~/.obd/log/obd)

看了日志里貌似一直在用meta租户去连数据库

  1. 使用得重启命令是什么呢。是直接restart吗?
  2. 是否可以直接连接么那?

一开始是用obd cluster stop xbsp 停止集群,但是由于21(装有express)的磁盘空间满了导致无法使用命令停止,就手动重启了21
然后21 扩容后 再obd cluster restart xbsp重启集群,数据库能连接 但是express就是起不来,我直接用meta租户连接数据库也连不上,但是root租户可以连

image

麻烦帮忙看一下

当前磁盘空间看下剩余:df -h &&free -h
重启集群先stop再start得方式试一下。

image
这是ocpexpress现在的空间和内存情况
重启集群先stop再start的方式我已经试过很多遍了 一直卡在start ocp-express
然后obd日志中,一直在连接21数据库
connect 192.168.3.21 -P2883 -umeta@ocp -pwzfp4MGLPE

ocp-express磁盘满了后,就扩容了下,任何参数都没改,然后重启集群 ocp-express就起不来了
但是root账号可以连数据库

用root登陆数据库
select a.zone, a.SVR_IP,a.SVR_PORT, b.status,cpu_capacity,cpu_assigned_max,cpu_capacity-cpu_assigned_max as cpu_free,round(memory_limit /1024/1024/1024 ,2) as memory_total_gb,round((memory_limit-mem_capacity) /1024/1024/1024 ,2) as system_memory_gb,round(mem_assigned /1024/1024/1024 ,2) as mem_assigned_gb,round((mem_capacity-mem_assigned) /1024/1024/1024 ,2) as memory_free_gb,round(log_disk_capacity /1024/1024/1024 ,2) as log_disk_capacity_gb,round(log_disk_assigned /1024/1024/1024 ,2) as log_disk_assigned_gb,round((log_disk_capacity-log_disk_assigned) /1024/1024/1024 ,2) as log_disk_free_gb,round((data_disk_capacity /1024/1024/1024 ),2) as data_disk_gb,round((data_disk_in_use /1024/1024/1024 ),2) as data_disk_used_gb,round((data_disk_capacity-data_disk_in_use) /1024/1024/1024 ,2) as data_disk_free_gb from gv$ob_servers a join oceanbase.DBA_OB_SERVERS b on a.zone=b.zone\G;
看看

再提供下observer.log和obd日志吧。

在哪个表里可以查看meta@ocp租户 或者重置该租户的密码?

obd.zip (4.5 MB)

配置文件麻烦也提供下。
cat ~/.obd/cluster/name(集群名称)/config-yaml 或者obd cluster edit-config name

config.txt (2.5 KB)

问题已解决,另外两台节点服务器虽然df -h显示还有2G磁盘空间,但应该是不够了,扩容后正常启动。