[求助]obd部署obproxy不成功

【产品名称】社区版-obproxy

【产品版本】3.1.0

【问题描述】

3节点集群,obproxy部署在其中一个节点上,集群启动成功,obproxy启动不成功。社区的几篇部署说明、yaml都参照尝试过。看proxy最后一条日志,启动完成耗时20秒,不知道哪不对。部分日志和yaml见附件。节点服务器内存16G,cpu:4c(部署obproxy的调整到了8c也试过)。

[root@oceanbase_x ~]# obd cluster deploy obcluster -c rpm/proxy_mini-distributed-example.yaml

oceanbase-ce-3.1.0 already installed

obproxy-3.1.0 already installed

±------------------------------------------------------------------+

| Packages |

±-------------±--------±-----------------------------------------+

| Repository | Version | Md5 |

±-------------±--------±-----------------------------------------+

| oceanbase-ce | 3.1.0 | 56f57e9843e719d830ec03c206d914f4b3adc82b |

| obproxy | 3.1.0 | 0b17cf0459a3b53c5a2febb6572894d183154c64 |

±-------------±--------±-----------------------------------------+

Open ssh connection ok

Remote oceanbase-ce-3.1.0-56f57e9843e719d830ec03c206d914f4b3adc82b repository install ok

Remote oceanbase-ce-3.1.0-56f57e9843e719d830ec03c206d914f4b3adc82b repository lib check ok

Remote obproxy-3.1.0-0b17cf0459a3b53c5a2febb6572894d183154c64 repository install ok

Remote obproxy-3.1.0-0b17cf0459a3b53c5a2febb6572894d183154c64 repository lib check ok

z1(10.1.10.16) initializes cluster work home

z2(10.1.10.17) initializes cluster work home

z3(10.1.10.18) initializes cluster work home

10.1.10.16 init cluster work home

obcluster deployed

[root@oceanbase_x ~]#

[root@oceanbase_x ~]# obd cluster start obcluster

Get local repositories and plugins ok

Start observer ok

observer program health check ok

Connect to observer ok

Initialize cluster

Cluster bootstrap ok

Wait for observer init ok

±---------------------------------------------+

| observer |

±-----------±--------±-----±------±-------+

| ip | version | port | zone | status |

±-----------±--------±-----±------±-------+

| 10.1.10.16 | 3.1.0 | 2881 | zone1 | active |

| 10.1.10.17 | 3.1.0 | 2881 | zone2 | active |

| 10.1.10.18 | 3.1.0 | 2881 | zone3 | active |

±-----------±--------±-----±------±-------+

Start obproxy ok

obproxy program health check x

[WARN] failed to start 10.1.10.16 obproxy

[ERROR] obproxy start failed

[root@oceanbase_x ~]#

请问能 上传一下你的  rpm/proxymini-distributed-example.yaml 配置文件内容吗?

上传附件,没注意网站不支持其他后缀,实际没上传成功,文件名后缀“.zip”是假后缀,直接去掉这个后缀。

obproxy.log.zip (46989 KB)

proxy_mini-distributed-example.yaml.zip (2832 KB)

obd.zip (528795 KB)

10.1.10.16 上是否还有obproxy的进程呢

如果进程存在,请在安装OBD的机器上执行obclient -h 10.1.10.16  -uroot@proxysys -P2883试试能不能登录到obproxy

可以登录,不带数据库登录后,执行use oceanbase报“…Lost connection…”,带oceanbase数据库登录后,执行“select * from __all_database”报错“…Unknow result”,查询其他表也一样,执行“use oceanbase”,也是报连接丢失

应该是之前的start过为意外中断了,导致proxyro账号没有创建。最简单的方式是直接redeploy。或者手动创建一个proxyro的账号

查了sys租户mysql.user表,用户proxyro已经存在,使用该用户登录并查询都正常,该用户密码为空。redeploy、destroy、更换cluster名称之前都试过很多次,都到代理这步失败

根据庆涛的指导,后续使用obclient -h10.1.10.16 -uroot@sys#obcluster -P2883 -p登录,并执行“show databases”能正确返回结果,说明集群和代理已经ok,可能是obd的问题,后续有时间再尝试清理集群、清理~/.obd及重装obd再试