ob升级后为何磁盘io使用率升高了?

【 使用环境 】测试环境
【 OB 】oceanbase
【 使用版本 】4.2.5.5
【问题描述】为什么从4.2.1.8升级到4.2.5.5后磁盘io变高使用率变高?

  1. 系统磁盘io使用node exporter监控采集
  2. 升级前数据盘的磁盘io利用率为1%,升级后sdc盘一致持续为5%左右
  3. 升级时间从12月31日06:22:16到06:56:54,其中2点为合并,4点半为备份
    【集群描述】
    集群为3个节点,日志盘为nvme0n1的一个盘,数据盘为sdb、sdc、sdd、sde4个盘做的卷
    【附件及日志】
  4. 磁盘io监控(node-exporter)
  5. obdiag采集的ash报告对比
    a. 12月30日9点30到10点30
    ash_report_20251231104427.txt (73.7 KB)

b. 12月31日9点30到10点30
ash_report_20251231104339.txt (181.5 KB)

  1. ocp控制台监控


2 个赞

image
这个是不是每日的合并呀


image
从ocp的截图sys租户 看这个时间 QPS是增加的 sql执行时间也是增加了的


ocp的截图 业务租户查看的话 看着某些语句执行的慢吧 是不是有等待呀

看着之前的物理io耗时是写的耗时高 这个应该和合并有关系吧 后来是读的耗时高 这个应该和语句执行有关系吧

3 个赞
  1. 上面2点到3点15是合并高,这个是每日都有的,属于正常
  2. 看到的从6点多以后sql请求多,是因为升级后sys租户的sql变多了,下面是sys租户的sql
    eeoob012_16413_sys_TopSQL_20260101115430.xlsx.zip (105.3 KB)

从以往的各个集群升级来看,新的版本sys租户的一些sql确实变多了,iops也多了不少,但是磁盘io利用率没有像昨天这个集群升级这么明显,观察了一天,看有所下降

1 个赞

没看明白

支持一下

业务高峰,正常吧

不正常,我们白天没有业务高峰,而且和前一天的对比,两个问号的地方明显比之前的io高很多

升级后,为何两个?号的地方,io变高了

怀疑是升级后block cache缓存没有了,导致的,升级后观察了3天,io恢复正常了,block cache的缓存也逐步恢复了


因为升级 需要重启 缓存被清理了 需要重新加载 会有io波动的 这个也正常