【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】3.1.4
【问题描述】
服务器cpu 64核 ,ob集群在部署时候配置的cpu资源是 50 , 集群中每个节点都一样,从监控看,在处理业务时候,ob集群的cpu资源没有限制住,导致服务器cpu使用率 99.7% 持续了几个小时,服务器负载从 10+ 逐渐涨到了 200+ ,服务器随时有宕机风险。
如何在ob集群中限制住资源,使得服务器更加稳定运行?
【复现路径】问题出现前后相关操作
【问题现象及影响】
OB 集群中
CPU 相关参数值
cpu_count: 50
workers_per_cpu_quota(默认值): 10
system_cpu_quota(默认值): 10
cpu_quota_concurrency(默认值): 4
net_thread_count(默认值): 0
SQL 查询OB集群资源的分配情况
obclient [oceanbase]> SELECT tenant_id,tenant_name,min_cpu,max_cpu,max_session_num FROM gv$unit \G;
*************************** 1. row ***************************
tenant_id: 1
tenant_name: sys
min_cpu: 2.5
max_cpu: 5
max_session_num: 9223372036854775807
*************************** 2. row ***************************
tenant_id: 1
tenant_name: sys
min_cpu: 2.5
max_cpu: 5
max_session_num: 9223372036854775807
*************************** 3. row ***************************
tenant_id: 1
tenant_name: sys
min_cpu: 2.5
max_cpu: 5
max_session_num: 9223372036854775807
*************************** 4. row ***************************
tenant_id: 1001
tenant_name: lph
min_cpu: 55
max_cpu: 55
max_session_num: 64
*************************** 5. row ***************************
tenant_id: 1001
tenant_name: lph
min_cpu: 55
max_cpu: 55
max_session_num: 64
*************************** 6. row ***************************
tenant_id: 1001
tenant_name: lph
min_cpu: 55
max_cpu: 55
max_session_num: 64
6 rows in set (0.020 sec)
【附件】