【 使用环境 】测试环境
【 OB or 其他组件 】observer
【 使用版本 】4.1
【问题描述】最近在测试ob的benchmark 的性能,三台同等配置的物理机作为observer 部署机器,一台机器作为obproxy 和benchmark运行机器,
数据导入后进行压测的时候,总是有个节点的CPU使用率比另外两台高10%左右,看到这台高的节点日志里面存在大量的4038 报错,说是无主,查文档这个报错是无主的报错,并且带有部分的日志限速的日志,但是看着好像也没问题,这个有什么排查思路不?
以下是操作过的一些参数及机器配置
CPU 96C | 内存 | 数据盘 |
---|---|---|
8260M*2 | 512G | P5510 7T*2 |
8260M*2 | 512G | P5510 7T*2 |
8260M*2 | 512G | P5510 7T*2 |
8260M*2 | 512G |
-- sys租户执行
ALTER system SET enable_sql_audit=false;
select sleep(5);
ALTER system SET enable_perf_event=false;
ALTER system SET syslog_level='PERF';
alter system set enable_record_trace_log=false;
-- alter system set system_memory='30G'; -- 官方推荐,但是先不动memory_limt/3 ≤ system_memory ≤ memory_limt
-- 需要重启
-- alter system set __easy_memory_limit='20G';
alter system set net_thread_count=16;
-- 设置超时时间为3天,避免超时线程断开,对应租户执行
set global ob_query_timeout = 259200000000;
set global ob_trx_timeout = 259200000000;
set global ob_trx_idle_timeout = 259200000000;
-- 每次重启obproxy 后需要重新设置下
ALTER proxyconfig SET proxy_mem_limited='32G';
ALTER proxyconfig set enable_compression_protocol=false;