启动数据库卡在start ocp-express第2贴

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】】用obd cluster start 【集群】启动数据库,卡在start ocp-express
ocp-express.rar (54.4 KB)
observer.zip (2.1 MB)

【复现路径】】用obd cluster start 【集群】启动数据库,卡在start ocp-express

1 个赞

obd.zip (1.3 MB)

1 个赞

连接ocp租户失败,ocp租户所在的数据库你连接测试下,是新部署的环境吗?可能ocp租户所在的数据库未正常启动或者网络策略等

–执行下
obclient -h10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex

[2024-08-01 00:13:00.031] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:02.029] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:04.032] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:06.031] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:08.030] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:10.029] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [ERROR] 10.208.200.205: failed to connect meta db
[2024-08-01 00:13:10.159] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [INFO] e[31m[ERROR]e[39m 10.208.200.205: failed to connect meta db
[2024-08-01 00:13:10.159] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [INFO]

1 个赞
  1. 您把您的服务器情况介绍下。 资源情况,
  2. 把您的配置文件发下
    image

#######################
特别注重下资源的问题,一般都是数据库服务器资源不足导致的

1 个赞

obd.zip里面的报错

  1. 检查下 2881端口是否已经启动或者ocenbase数据库已经启动成功,虽然ocp-express失败了
  2. 进去看看 租户是否存在 select tenant_name from oceanbase.__all_tenant; 截图发出来
  3. 如果租户不存在 , 说明您在部署的时候 就报错了 ,或者删除掉集群重新部署下吧
1 个赞

是生产数据库,用了很长时间,数据不能丢。

1 个赞

那您把 前两步骤 截图发出来看下。 看看能不能进去

1 个赞

故障前有没有什么变更或者操作?
OB和ocp-express的部署架构也发下

1 个赞

数据库起不起来,进不去。

1 个赞

1.有没有开备份恢复?
2.obd版本?
3. 贴下脱敏后的 config文件 在~/.obd/cluster/{deployname}/config.yaml

1 个赞

j进入库时
Access denied for user‘root’@‘XXX.XXX.XXX.XXX’ (using passeord:YES)

故障时按一个技术支持人员装了个obdiag,但也不能用。

看一下log盘是不是满了

No memory or reach tenant memory limit([OOPS]=“alloc failed reason”, msg=tenant memory has reached the upper limit(tenant_id: 1002, tenant_hold: 1071828992, tenant_limit: 1073741824, alloc_size: 2097152)) 租户内存满了

密码不对吧。这个一般是密码不对

1.确认下是否黑屏化改过系统租户密码
2.描述下数据库关机操作即启动操作场景及流程
3.提供一份ob的yaml
4.提供一下df -h,free -g
5.参考obdiag文档配置obdiag初始化 可以先做一下日志分析

clog盘满

obdiag gather scene run --scene=observer.clog_disk_full

在线分析最近一小时的日志,诊断出出现过的错误

obdiag analyze log --since 1h

内存问题

obdiag gather scene run --scene=observer.memory


obdiag也不合适。log在home里

这个要怎么修改?

能登录到sys租户吗

不能