obproxy连接异常问题

偶尔出现集群和obproxy运行几天后会出现 obproxy 无法连接集群的情况,报错如下:

重启集群后,一切恢复正常。

os : ubuntu 24.04
oc-ce : 4.3.5_BP1

---------------- 补充
obproxy 报错如下:

可以确定密码是没问题的,因为一直在正常使用的。

1 个赞

麻烦到obproxy目录执行下该命令。
dmesg -T | grep obproxy | tail

1 个赞

请问是 obproxy 主目录还是bin目录?

都试了下,无任何输出。

1 个赞

黑屏化登录root@proxysys确认下observer_sys_password密码是否与proxyro@sys一致

2 个赞

proxy的日志目录下

1 个赞

我在ce global 中配置了 proxyro_password ,然后 obproxy 是依赖于ce的,并未单独配置该值,按照文档描述应该是获取ce中的proxyro_password,所以应该是一致的吧。

这个问题很奇怪,它没有规律,在我测试集群的2周内,出现了2~3次,每次都是上面的错误,然后重启集群就好了。

1 个赞

麻烦提供一份覆盖登录报错的详细日志。

1 个赞

login-error.zip (27.3 KB)

这是登录obproxy报错前后的日志。observer可以直连,就是无法连接obproxy。

看样子是手动修改过其中一个密码

这个可以肯定,绝对没有的。因为我们只设置完 ce 密码,所有都依赖于这个部署的。后面就不会修改密码了。而且,外部都是用 proxy 访问如果要有人修改了密码早就发现了。而且集群节点外人也登录不上去的。最诡异的是,重启后就好了。

有没有什么组件服务会修改这个密码的?(可是我们除了 ce 和 proxy 也没部署其他模块)

请教下,如果下次再次出现这个问题,我该从哪些方面做信息留档,以便排查这个问题?我担心线上如果这样搞一次,就麻烦了。

在ce global 中配置了 proxyro_password ,然后 obproxy 是依赖于ce的,并未单独配置该值,按照文档描述应该是获取ce中的

看你描述你是黑屏化部署的obproxy。应该是缺少了哪一步导致,你可以试试使用obd安装部署

我是严格按照官网 obd 命令行方式集群部署的 ce + proxy。一切都很顺利,就是偶尔出现这个现象比较奇怪。我打算重新安装一次集群再试试。

提供一份你的yaml文件看看

temp2.zip (1.2 KB)

使用2883端口 -P2883 -urpoxyro@sys -p登录一下看看是否能正常连接

现在什么都可以了,故障时忘了测这个了,但是使用任何用户,无论是ce用户,还是proxy用户都无法连接ce,我记下了,下次我试试用这个账户连接proxy试试。

obproxy版本是多少

我突然发现还是不一样的哦,我用proxyro账户直连ce是ok的,但是通过 proxy 就不行,这是为什么?我用其他测试账户,无论是连ce还是proxy都是ok的。这是什么情况?