【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】】用obd cluster start 【集群】启动数据库,卡在start ocp-express
ocp-express.rar (54.4 KB)
observer.zip (2.1 MB)
【复现路径】】用obd cluster start 【集群】启动数据库,卡在start ocp-express
【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】
【问题描述】】用obd cluster start 【集群】启动数据库,卡在start ocp-express
ocp-express.rar (54.4 KB)
observer.zip (2.1 MB)
【复现路径】】用obd cluster start 【集群】启动数据库,卡在start ocp-express
连接ocp租户失败,ocp租户所在的数据库你连接测试下,是新部署的环境吗?可能ocp租户所在的数据库未正常启动或者网络策略等
–执行下
obclient -h10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:00.031] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:02.029] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:04.032] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:06.031] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:08.030] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [DEBUG] — connect 10.208.200.205 -P6632 -umeta@ocp -p2TmbxNErex
[2024-08-01 00:13:10.029] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [ERROR] 10.208.200.205: failed to connect meta db
[2024-08-01 00:13:10.159] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [INFO] e[31m[ERROR]e[39m 10.208.200.205: failed to connect meta db
[2024-08-01 00:13:10.159] [4f4926dc-4f56-11ef-bd67-fefcfe7d4f4b] [INFO]
#######################
特别注重下资源的问题,一般都是数据库服务器资源不足导致的
obd.zip里面的报错
是生产数据库,用了很长时间,数据不能丢。
那您把 前两步骤 截图发出来看下。 看看能不能进去
故障前有没有什么变更或者操作?
OB和ocp-express的部署架构也发下
数据库起不起来,进不去。
1.有没有开备份恢复?
2.obd版本?
3. 贴下脱敏后的 config文件 在~/.obd/cluster/{deployname}/config.yaml
j进入库时
Access denied for user‘root’@‘XXX.XXX.XXX.XXX’ (using passeord:YES)
故障时按一个技术支持人员装了个obdiag,但也不能用。
看一下log盘是不是满了
No memory or reach tenant memory limit([OOPS]=“alloc failed reason”, msg=tenant memory has reached the upper limit(tenant_id: 1002, tenant_hold: 1071828992, tenant_limit: 1073741824, alloc_size: 2097152)) 租户内存满了
密码不对吧。这个一般是密码不对
1.确认下是否黑屏化改过系统租户密码
2.描述下数据库关机操作即启动操作场景及流程
3.提供一份ob的yaml
4.提供一下df -h,free -g
5.参考obdiag文档配置obdiag初始化 可以先做一下日志分析
obdiag gather scene run --scene=observer.clog_disk_full
obdiag analyze log --since 1h
obdiag gather scene run --scene=observer.memory
这个要怎么修改?
能登录到sys租户吗
不能