升级过程中,execute upgrade post scripte 这个过程是做什么的,是否可以跳过,任务一直卡在这个过程,我看observer已经升级完成了

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】社区版OB4.2.1.2升级至4.2.1.8
【 使用版本 】OCP4.3.1
【问题描述】升级过程中,最后阶段的execute upgrade post scripte 这个过程是做什么的,是否可以跳过,任务一直卡在这个过程,重试几次也不行。我看observer已经升级完成了
【复现路径】
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):

【SOP系列 22 】——故障诊断第一步(自助诊断和诊断信息收集)

【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!

根据您的描述,在使用 OCP 对 OceanBase 集群进行版本升级的过程中遇到了问题,具体是在执行升级后的脚本步骤时出现了停滞现象。

由于 obdiag 目前没有直接针对升级过程卡顿的特定场景支持,但我们可以先通过采集集群的基础信息来定位可能存在的问题。

日志采集场景: 集群基础信息
日志采集命令: obdiag gather scene run --scene=observer.base

请您执行上述命令并提供采集到的日志压缩包,这将有助于我们进一步分析问题所在。

为了更准确地定位问题,请您提供一些额外的信息:

  1. 您是否在升级过程中遇到了任何具体的错误信息或警告?
  2. 在执行升级操作前后,集群的硬件资源(如 CPU、内存、磁盘空间等)是否有明显的变化或限制?
  3. 升级过程中是否有其他维护操作或异常情况发生?
  4. 您能否提供执行升级操作时 OCP 控制台上的相关日志或提示信息?

详情请参考:

  1. 升级概述
  2. 升级 OceanBase 集群
  3. 恢复完成后升级租户
  4. 使用 OBD 升级 OceanBase 数据库

附上敏捷诊断工具 obdiag 使用帮助链接

另外升级前发现一个现象,有一个租户一直无法删除(使用OCP删除后又会自动新建出来,但是使用黑屏命令删除时又报租户不存在,dba_ob_tenants中还存在这个租户名),使用2881直连这个租户一直卡住无法连接,但是不报错,这是不是BUG问题

根据您描述的现象,您在尝试删除一个租户时遇到了困难,使用 OCP 删除后该租户会自动重建,而当您尝试通过黑屏命令删除时却被告知租户不存在。此外,您还提到当尝试通过直连端口 2881 连接到该租户时,连接会卡住而不会返回错误信息。这些现象确实表明存在一些异常情况。

以下是针对您遇到的问题的一些建议:

  1. 租户删除问题

    • 您提到在 dba_ob_tenants 表中仍然可以看到该租户的信息。这可能意味着该租户的状态处于一种特殊的状态,可能是由于某些内部元数据未能正确更新导致的。建议检查该租户在 dba_ob_tenants 表中的详细信息,特别是 status 字段,看看是否存在异常状态。
    • 尝试使用管理员权限登录到系统租户,并执行 ALTER TENANT 命令来修改租户的状态,然后再尝试删除。例如,您可以先锁定租户,再尝试删除:
      ALTER TENANT tenant_name STATUS = 'LOCKED';
      DROP TENANT IF EXISTS tenant_name;
      
  2. 连接问题

    • 当您尝试通过直连端口 2881 连接到该租户时,连接卡住而不返回错误信息,这可能是因为该租户的状态或配置导致连接请求被挂起。您可以尝试使用 SHOW PROCESSLIST; 命令查看当前活跃的连接,看看是否有异常的连接请求。
    • 如果连接问题持续存在,建议检查该租户的配置,特别是网络相关的设置,确保其配置正确且没有阻止连接的规则。
  3. 进一步排查

    • 您可以尝试收集更多的日志信息,特别是与租户管理和连接相关的日志,以便更好地理解问题的原因。您可以使用 obdiag gather 命令来收集集群的日志信息,并提供给技术支持团队进行进一步分析。
    • 如果问题依然无法解决,建议联系 OceanBase 的技术支持团队,他们可以提供更深入的技术支持和解决方案。

希望这些建议能够帮助您解决问题。如果您还有其他疑问或需要进一步的帮助,请随时告知。

具体信息可参考以下文档:

  1. 通过 MySQL 客户端连接 OceanBase 租户
  2. 通过 OBClient 连接 OceanBase 租户
  3. 锁定和解锁用户
  4. 用户被锁,错误代码 ERROR 3118
  5. 使用 ChunJun 从 MySQL 数据库迁移数据到 OceanBase 数据库

(小助手的答复已结束,如未能解决您的问题,请继续提问并等待其他同学的回复,谢谢!)

把你具体的升级步骤发一下 查一下这个信息 select * from DBA_OB_CLUSTER_EVENT_HISTORY where module like ‘%upgrade%’;
麻烦找下升级日志:
upgrade_checker.log
upgrade_cluster_health_checker.log
upgrade_post.log
upgrade_pre.log

observer.log的日志也发一下

升级已完成,确定是BUG导致

啥 bug ?能分享一下经验吗?

更新__all_tenant和__all_tenant_history中的BUG租户为其它名字,之后重启OB使用OCP将原租户名字(BUG租户)删除。命名租户时不要使用特使含义的名字

1 个赞