【 使用环境 】测试环境
【 OB or 其他组件 】OB
【 使用版本 】OCP:4.35,OceanBase:4.2.1.8
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
【 使用环境 】测试环境
【 OB or 其他组件 】OB
【 使用版本 】OCP:4.35,OceanBase:4.2.1.8
【问题描述】清晰明确描述问题
【复现路径】问题出现前后相关操作
【附件及日志】推荐使用OceanBase敏捷诊断工具obdiag收集诊断信息,详情参见链接(右键跳转查看):
【备注】基于 LLM 和开源文档 RAG 的论坛小助手已开放测试,在发帖时输入 [@论坛小助手] 即可召唤小助手,欢迎试用!
在这个情况下,您的问题与 DDL 操作有关,可能是由于特定的功能或功能组合在当前版本中不受支持导致的。为了更准确地定位问题,我们可以先通过 obdiag 工具来收集相关信息。
日志采集场景: DDL过程中的问题
日志采集命令: obdiag gather scene run --scene=observer.ddl_failure
请您执行上述命令收集日志,并将生成的日志文件提供给我们进一步分析。
此外,请您提供以下信息以便于我们更好地了解情况:
ALTER SYSTEM ADD SERVER
之前,是否已经执行过类似的命令或进行了任何配置更改?感谢您的配合!这将有助于我们快速找出问题的原因并提供解决方案。
附上敏捷诊断工具 obdiag 使用帮助链接
补充说明一下,参考的文档链接是https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002013119
黑屏操作的么?架构信息发一下
这个问题的背景是这样的:这套集群最开始是通过OCP安装的,但是OCP服务器硬件损坏了,并且集群中有一台服务器observer起不来,现在新搭建的OCP对集群进行接管时,因为这台observer未启动无法接管,所以需要新添加一个observer替换这台启动不了的observer
这是配置文件信息,您看还需要提供其他信息吗?
饗€€ 嫁 D ? ? ??邌€€ _enable_dbms_job_package=False
observer_id=1
local_ip=192.168.3.71
enable_cgroup=True
_bloom_filter_ratio=3
data_disk_usage_limit_percentage=90
all_server_list=192.168.3.227:2882,192.168.3.228:2882,192.168.3.229:2882,192.168.3.71:2882,192.168.3.72:2882,192.168.3.73:2882
resource_hard_limit=120
log_disk_size=35G
min_observer_version=4.3.5.0
memory_limit_percentage=80
syslog_level=WDIAG
obconfig_url=http://192.168.33.95:8080/services?Action=ObRootServiceInfo&User_ID=alibaba&UID=ocpmaster&ObRegion=obtest
cluster_id=1745292874
cluster=obtest
rootservice_list=192.168.3.71:2882:2881;192.168.3.73:2882:2881;192.168.3.228:2882:2881
enable_record_trace_log=False
system_memory=10G
zone=zone1
devname=eno3
mysql_port=2881
rpc_port=2882
config_additional_dir=/usr/local/data/log1/obtest/etc2;/home/admin/data/1/obtest/etc3
data_dir=/home/admin/oceanbase/store/obtest
鍎€€ 秬€€ [1]
瑎€€ compatible=4.3.5.0
cpu_quota_concurrency=10
爛€€ [1001]
搥€€ compatible=4.3.5.0
€€ [1002]
榿€€ ha_low_thread_score=10
standby_db_fetch_log_rpc_timeout=15s
_parallel_ddl_control=TRUNCATE_TABLE:ON, SET_COMMENT:ON, CREATE_INDEX:ON
compatible=4.3.5.0
爛€€ [1003]
搥€€ compatible=4.3.5.0
€亐€ [1004]
髝€€ ha_low_thread_score=10
_parallel_ddl_control=TRUNCATE_TABLE:ON, SET_COMMENT:ON, CREATE_INDEX:ON
compatible=4.3.5.0
爛€€ [1005]
搥€€ compatible=4.3.5.0
€亐€ [1006]
髝€€ ha_low_thread_score=10
_parallel_ddl_control=TRUNCATE_TABLE:ON, SET_COMMENT:ON, CREATE_INDEX:ON
compatible=4.3.5.0
如果架构是1-1-1的 坏了一个节点 集群应该是可用的 可以在ocp上直接添加一台主机 接管到这个集群就好了 ocp截图看看集群信息
大致看了一下需求,有两个
ocp接管集群与替换ob server
这两个操作都有一些操作步骤,所以需要一个一个来。
先替换ob server
接管集群
在旧的ocp上先移出集群
才能在新的ocp上接管集群