【产品调研➕送积分】在OCP各操作界面中,您最常遇到的10个典型问题或困惑有哪些?参与调研即有机会获得50积分奖励

问题一、使用场景描述

在OCP 的不同操作界面中,您最常遇到哪些咨询或查询需求?例如

集群管理 → 概览页面:

  • 集群整体健康状态评估(如:“当前集群的健康评分如何?是否存在潜在风险?”)
  • 资源使用情况分析(如:“存储空间预计还能使用多久?需要扩容吗?”)

租户管理 → 备份恢复页面:

  • 备份任务故障排查(如:“备份任务失败的可能原因有哪些?如何快速定位?”)
  • 恢复操作指导(如:“数据恢复的最佳实践和注意事项?”)

问题二、当前痛点识别

您在解决上述问题时,通常遇到哪些困难?

  • :mag: 信息分散 :需要跨多个页面或查看不同指标才能获得完整信息
  • :alarm_clock: 响应延迟 :问题诊断需要人工分析,无法实时获得解答
  • :hammer_and_wrench: 技术门槛 :某些深度洞察需要命令行操作,对运维人员要求较高
  • :bar_chart: 数据关联 :难以快速关联不同监控指标间的因果关系

问题三、功能期望

您希望OCP 如何为您提供服务?

【调研参与奖励】

分享你的智慧!本帖会选择 10 位优质回答者,分别获得 50 积分大奖!

7 个赞
  1. 经常遇到此类告警,个人感觉文档写的有点疑惑,不明白此类指标告警是不是可以优化,细化一下,这8个通常排查问题,不好排查,有点头疼,经常还都是正常

14 个赞

ocp topsql界面展示存在bug,选择的时间范围区间实际上是ocp_monitor数据库中的ob_hist_sql_audit_stat_0表的相关列begin_interval_time或end_interval_time来的,这样,我们在精细分析问题的时候,可能和ocp纳管的集群出现问题的时间点无法匹配,导致分析出现误差,应使用max_request_time或min_request_time来限定。

14 个赞
  1. 此类告警是不是可以聚合,告警个数太多,影响不好
14 个赞

不能吧,ip都不一样

14 个赞

这里聚合,感觉容易忽视整体问题

17 个赞

1、使用最多的场景当然是SQL诊断和性能监控,
2、有个反馈的点就是新版本性能监控的时间选择太难用了,日期只能手动输入,不像SQL诊断页面是出来个日历让自己选择,以前都是能直接选择日期
3、希望新增一个创建集群或租户的时候能不能有个将已修改参数保存为模板的功能,比如有时候已经改了很多参数这个时候才想保存成模板,这个时候就比较尴尬新建模板反而需要重新输一次
还有就是OCP能不能对于生成的性能报告给出一些简单的分析建议,就SQL诊断给出的建议一样,不一定要多么精准,但是可以让看报告的人知道关注哪些地方

17 个赞

学习了,感谢分享!

14 个赞

问题一、使用场景描述
最常遇到的是告警查看、性能监控和SQL诊断功能。
数据库管理功能在查看磁盘使用量时也会经常用到。
备份恢复也是常用的功能
问题二、当前痛点识别
性能监控对内存的使用情况不太直观;
告警信息中很多SQL执行次数超限、SQL性能下降等告警没有给出具体sql和解决方法,感觉意义不大
数据库管理中查看磁盘使用量时不太准确也是一个痛点
问题三、功能期望
SQL诊断希望能给出更详细的信息和解决方案

14 个赞

用的少,还没有发现问题

13 个赞

打卡

11 个赞

学习

9 个赞

学习各位大佬的经验

8 个赞

学习

6 个赞

打卡

5 个赞

学习了,感谢分享!

5 个赞

1、SQL性能问题告警特别多
2、CPU已分配资源是预分配的不是实际使用的吧?

4 个赞

:+1: :+1: :+1: :+1:

3 个赞

问题一、使用场景描述
1、自治服务 → 实时诊断,查看SlowSQL
2、日志服务,查看ob日志,分析报错原因
3、告警,查看告警监控
4、集群->资源管理,查看leader副本所在节点

问题二、当前痛点识别
1、告警和日志服务没有关联,建议可以直接从告警跳转到对应的日志服务中,自动展示对应的日志
2、打开WR报告非常慢,有时候浏览器会卡死,看看能否优化
3、SlowSQL中的常用列无法记忆,往往下次打开后又回去了

问题三、功能期望
1、对gv$ob_sql_audit保留时间较短,且查询效率较低,建议在ocp进行快照,可以快速查看
2、整合obdiag相关功能
3、OCP能像observer一样实现4F1A的两地三中心部署方式

3 个赞

每日学习打卡