ob-ce-3.1.4,新部署完的集群,重启失败

ob-ce-3.1.4
刚部署完的集群,尝试重启失败
observer报错:

[2022-11-07 10:06:02.912934] ERROR [SERVER.OMT] alloc (ob_worker_pool.cpp:93) [24864][454][Y0-0000000000000000] [lt=22] [dc=0] worker cnt larger than max cnt(worker_cnt_=256, max_cnt_=256) BACKTRACE:0x9a99e6e 0x986e111 0x22e265f 0x22e22ab 0x22e2072 0x22d2ac4 0x92e3ed2 0x92e79dd 0x92e8033 0x92f1024 0x92f15b7 0x2cac102 0x9821d75 0x9820762 0x981d21f

找到两个相关旧帖
worker cnt larger than max cnt - OceanBase - 社区问答- OceanBase社区-分布式数据库

ob有如何下报错,麻烦帮忙看一下。 - OceanBase - 社区问答- OceanBase社区-分布式数据库

提示要调大 sys_cpu_limit_trigger,但现在已经无法启动了,怎么调整,麻烦给个更详细点的说明,谢谢

方便传下完整的日志么

不好意思啊,刚铲掉重新部署了,后面复现的话再上传日志,谢谢

新安装完的3.1.4集群,连接obproxy提示错误:

$ mysql -h127.0.0.1 -P3308 -uroot@sys -A
ERROR 2013 (HY000): Lost connection to MySQL server at 'reading authorization packet', system error: 0

$ obclient -h127.0.0.1 -P3308 -uroot@sys -A
ERROR 2013 (HY000): Lost connection to MySQL server at 'reading authorization packet', system error: 11

这是怎么回事呢

是直连obproxy的方式还是直连ob的?,使用的oceanbase版本是什么,是社区版的3.1.4么

  1. 直连obproxy
  2. 是ob-ce-3.1.4版本
$ /home/admin/obproxy/bin/obproxy -V
obproxy (OceanBase 3.2.3.5 2)
REVISION: 1-local-4cc2f2e1f696a76e0b5831f6e88e76e0a6831255
BUILD_TIME: Sep  5 2022 19:47:46

obclient [(none)]> \s
--------------
obclient  Ver 2.0.2 Distrib 10.4.18-MariaDB, for Linux (x86_64) using readline 5.1

Connection id:          3221749764
Current database:
Current user:           root@172.16.16.7
SSL:                    Not in use
Current pager:          stdout
Using outfile:          ''
Using delimiter:        ;
Server version:         5.7.25 OceanBase 3.1.4 (r100000112022102717-39c3a048177154899edf1160e873979ea78dadd1) (Built Oct 27 2022 18:03:03)

这是我们一个已知的问题,cpu count配小了会遇到;ob的cpu是可以超卖的;建议调大CPU
count的值;

另外你们是通过什么方式部署的ob?

cpu_count调成不低于16

我用obd工具部署的。
要怎么调大cpu count呢。

调大cpu_count这个配置项;obd部署,除非yamlim显式指定,最低以cpu count 16启动,你是不是改过yaml中的cpu_count?

obd部署时,没改过cpu count设置。
云主机也只有4个逻辑CPU,没有16个。
(用同一份yaml文档)重新部署一次后,目前暂时正常。