使用OCP创建租户失败

【 使用环境 】测试环境
【 OB or 其他组件 】OCP
【 使用版本 】版本号: 4.2.1-20231116
【问题描述】
通过OCP创建租户的时候报错(昨天还可以创建成功今天就不行了,我把昨天创建成功的已删除了)
附件是通过OCP创建的日志

【复现路径】

log_task_10000010.zip (4.3 KB)

创建失败的截图可以发下

创建报错是什么


您好截图如下


您好,截图如下

可以试下右上角 重试 或者放弃任务再重新创建租户,看看是不是还是这个问题

OK,这个是超时了

访问什么超时了呢?需要怎么解决?

我重新装了好几遍都是这个问题

show variables like ‘%timeout%’;
连接数据库看下这个输出

看日志是数据库执行最后创建租户和资源池关联关系时超时了。如果右上角的重试无效的话,可以看下observer日志。
1) select * from gv$ob_audit_sql where query_sql like ‘%create tenant%’; 找到对应的trace_id信息。
2)去ob节点的日志目录下 grep “trace_id串信息” observer.log 看下具体超时原因。


你好,我在sys用户查看查看不到

4.7observer.rar (2.7 MB)
4.9observer.rar (4.8 MB)
4.8observer.rar (2.1 MB)
4.7ocp-express.rar (1.7 MB)

抱歉 表名是gv$ob_sql_audit

我查了一下是空的,这个我要重新在安装一下这个集群么?

47节点日志看到 找不到目录地址了,建议检查下这个节点磁盘或者目录是否和其他节点有什么不同。

[2023-11-29 17:19:47.586360] EDIAG [CLOG] renameat_until_success_ (ob_server_log_block_mgr.cpp:1375) [16589][T1007_L0_G0][T1007][YB4A0A000407-00060B310E94B152-0-0] [lt=6][errcode=-9100] ::renameat failed(ret=-9100, this={dir::"/mnt/xjws/oceanbase/store/clog/log_pool", dir_fd:14, meta_fd:15, log_pool_meta:{curr_total_size:53687091200, next_total_size:53687091200, status:0}, min_block_id:2116, max_block_id:2838, min_log_disk_size_for_all_tenants_:15569256448, is_inited:true}, dest_dir_fd=194, dest_block_path="0", src_dir_fd=14, src_block_path="2114") BACKTRACE:0x11061875 0x6981fe4 0x6981b71 0x69817ea 0x69815db 0x850fd3c 0x85019c0 0x850108e 0x69b744c 0x6b2fd31 0x6b30f7b 0x6a012ec 0x6a026a5 0x6b49889 0x84edd30 0x84ed895 0xd3f8481 0xd50dd91 0x96c5609 0x4c6220a 0x48b4f07 0x48ae61b 0x92f7094 0x116e68cf 0x7f39f6c50ea5 0x7f39f6979f3d
[2023-11-29 17:19:47.587252] ERROR issue_dba_error (ob_log.cpp:1866) [2582][T1001_IOWorker][T1001][Y0-0000000000000000-0-0] [lt=12][errcode=-4388] Unexpected internal error happen, please checkout the internal errcode(errcode=-9100, file="ob_server_log_block_mgr.cpp", line_no=1375, info="::renameat failed")


我昨天早上将这几个删除了,还在4.7的目录上操作了
alter system set memory_limit=‘10G’
还增加了一个log日志的大小
然后昨天下班的时候发现4.7宕机了,今天也启动不了

我还发现一个问题就是我改了内存的值今天重启集群发现我其它两台集群的内存值又变回了5G

建议先确认47节点故障问题,修复后再重装。
或者重装成2节点或单机的。

好的,麻烦能帮忙看一下


这个有提示为啥会宕机么?