ob集群节点cpu 99.7%,超出配置资源

【 使用环境 】生产环境
【 OB or 其他组件 】
【 使用版本 】3.1.4
【问题描述】
服务器cpu 64核 ,ob集群在部署时候配置的cpu资源是 50 , 集群中每个节点都一样,从监控看,在处理业务时候,ob集群的cpu资源没有限制住,导致服务器cpu使用率 99.7% 持续了几个小时,服务器负载从 10+ 逐渐涨到了 200+ ,服务器随时有宕机风险。

如何在ob集群中限制住资源,使得服务器更加稳定运行?

【复现路径】问题出现前后相关操作
【问题现象及影响】
OB 集群中

CPU 相关参数值

cpu_count: 50
workers_per_cpu_quota(默认值): 10
system_cpu_quota(默认值): 10
cpu_quota_concurrency(默认值): 4
net_thread_count(默认值): 0

SQL 查询OB集群资源的分配情况


obclient [oceanbase]> SELECT tenant_id,tenant_name,min_cpu,max_cpu,max_session_num FROM gv$unit \G;                
*************************** 1. row ***************************
      tenant_id: 1
    tenant_name: sys
        min_cpu: 2.5
        max_cpu: 5
max_session_num: 9223372036854775807
*************************** 2. row ***************************
      tenant_id: 1
    tenant_name: sys
        min_cpu: 2.5
        max_cpu: 5
max_session_num: 9223372036854775807
*************************** 3. row ***************************
      tenant_id: 1
    tenant_name: sys
        min_cpu: 2.5
        max_cpu: 5
max_session_num: 9223372036854775807
*************************** 4. row ***************************
      tenant_id: 1001
    tenant_name: lph
        min_cpu: 55
        max_cpu: 55
max_session_num: 64
*************************** 5. row ***************************
      tenant_id: 1001
    tenant_name: lph
        min_cpu: 55
        max_cpu: 55
max_session_num: 64
*************************** 6. row ***************************
      tenant_id: 1001
    tenant_name: lph
        min_cpu: 55
        max_cpu: 55
max_session_num: 64
6 rows in set (0.020 sec)

【附件】


1、查看下各个租户cpu max值是否超出设置的上限
2、关闭超卖
https://www.oceanbase.com/docs/community-observer-cn-10000000000449390