OceanBase集群存在不工作 OBServer

最新日志给你了

学到了

这个磁盘 utils% 使用率高 ,是不是磁盘调度算法问题?

[root@obs24 ~]# more  /sys/block/sda/queue/iosched/read_expire
500
[root@obs24 ~]# more  /sys/block/sda/queue/iosched/writes_starved 
2
[root@obs24 ~]# cat /sys/block/sda/queue/scheduler
[mq-deadline] kyber bfq none

这个是 iostat 输出信息:

这个是系统 内核参数
image

[root@obs24 ~]# more  /sys/block/sda/queue/iosched/read_expire
500
[root@obs24 ~]# more  /sys/block/sda/queue/iosched/writes_starved 
2
[root@obs24 ~]# cat /sys/block/sda/queue/scheduler
[mq-deadline] kyber bfq none

@靖顺 帮忙看看这个内存参数和磁盘调度算法有没有问题?

[root@obs24 ~]# cat /sys/block/sda/queue/scheduler
[mq-deadline] kyber bfq none

我看了下,这个调度算法是 读优先级高,写优先级低,这个会不会导致 clog hang 的问题?

select * from dba_objects;

不在集群中吗

学到了

172.26.104.123 服务器出现clog hang 问题,这个clog 主要是写日志,写请求很大,我查看监控 ob集群整体是写请求大于读请求

读:写 = 1:18


我查看 clog 所在的 lv /data/log1 所在的sda 的磁盘IO 调度算法是 mq-deadline ,属于多队列 读密集型 算法。

读请求优先处理(减少应用延迟),写请求批量合并(提高吞吐量)
读超时

写超时:

写饥饿 表示允许读请求优先处理 2 次后才处理写请求,对于写密级型 数据库不太合适

队列深度

wrqm/s 每秒合并的写请求数 ,可以看到 磁盘 sda 写大于读, 写合并次数 349 比较大

结论:
1、 对于写密级型 数据库 ,磁盘调度算法 mq-deadline 是否合适?

学习学习

了解了解

这个clog is hang 会不会跟渐进合并有关 ?

主要没有抓到cpu load高的时候 子线程cpu的使用情况 不能确定是那个子线程的问题

链接:https://foreignfile.catl.com/outpublish.html?code=A7547c55161fe4379a03d444f5560beb2&lang=zh-cn#view
密码:F0F7FED3