【 使用环境 】生产环境
【 OB or 其他组件 】oblogproxy 4.2.3
【问题描述】
oblogproxy 正常通过 run.sh start 启动成功后,它会监听2983端口。
运行一段时间后(可能是几天,也可能是几周),oblogproxy 会突然不好使,具体表现为:
- SHOW MASTER STATUS 命令报错,大意是无法连接oblogproxy (具体忘了截图)
- 原本【监听】的2983端口,也不监听了,但binlog_instance进程还在, /home/ds/oblogproxy/bin/logproxy进程挂掉了
重启oblogproxy 又好了
/home/ds/oblogproxy/log/logproxy.log里有如下日志:
2 个赞
常见原因
内存泄漏或句柄泄漏
oblogproxy 在长时间运行中堆积状态或缓存对象,最终触发崩溃。
版本 4.2.3 曾被用户反馈有 连接泄漏或 channel 无效未清理的问题。
异常连接(如 TCP 半开)未清理
导致 epoll/select 触发死循环,CPU 占满或自杀。
日志切换 / binlog 分片错误
oblogproxy 遇到 DDL、切换日志等特殊事件处理失败。
系统资源限制
如 ulimit -n 文件句柄太小或 OOM 被系统 kill(查看 dmesg 有帮助)。
进程守护机制失效
binlog_instance 未正确监控并拉起 logproxy。
1 个赞
独善其身
#4
单从日志中好像看到了无法分配内存,具体的还得深入日志分析
淇铭
#6
把宕机时间点的这个四个日志 提供一下
binlog_instance.log
libobcdc.log
logproxy.log
obproxy.log