【紧急问题】生产环境部署的obproxy bug确认

1.请上传一下包含报错时段的obproxy.log,产生的core日志或者core文件
2.发下observer,obproxy的详细版本
3.描述下当前部署架构,obproxy是和ob同服务器吗?

1、obproxy.log日志前面传递了,没有产生core日志,不知道core日志的产生规则是什么,之前崩溃是产生了几个,但是我们想看看最新的,结果怎么崩溃都没有在obproxy服务商尝试core日志。

2、目前:observer4.3.2.1,崩溃的obproxy版本4.3.1.0-4

3、obproxy和observe是不同服务器,在同一个机房,不同的虚拟机上,操作系统ubuntu24.02。

我看了前面发的 obproxy_diagnosis.logobproxy_error.log 文件,是没有有效信息的,如果异常时段的obproxy.log还在的话 麻烦发下 以便于确定根因

我们马上再装一个,然后压测提供日志

OBPROXY_LOG_tsz_192.168.3.108_20240929140545_20240929150545.zip (3.5 MB)

刚新装的,就证明不是配置问题,我们是把代理集群都删除,操作系统还原重装的压测的,坚持了4秒

有几个obproxy节点呢?自动重启的是192.168.3.114节点吗?发的日志是192.168.3.114节点的吗?

另外看下 obproxy根目录下是否生成了 minidump 目录?如果有麻烦打包发下

我们有两个节点,108和114 现在114是已经装成4.2.1在用了,108是没有用起来的,刚刚重新装了4.3.1

OK,发的日志和报错节点对得上就可以下,另外看下 obproxy根目录下是否生成了 minidump 目录?如果有麻烦打包发下

是OCP自动安装的,是不是 minidump 是不是在home/oceanbase/obproxy下面?

是的,如果安装在oceanbase用户下,就在这里


没有生成日志

这里直接记录到重启了,退出是不确定的,

部署用户下看下 ulimit -a

发一下 proxy 的参数:proxy_mem_limited 的值看看?

之前的core文件还有吗?如果有麻烦发一个

或者查找一下

find / -name "core*"

108没有生成,

1 个赞

find / -name "core*"

core*,你写的是code.*

1 个赞

我有昨天晚上114 和108的,稍等上传 有点大

多大呢?我加你钉钉了,可以钉钉联系