K8S部署OceanBase社区版4.1

【 使用环境 】生产环境 or 测试环境
【 OB or 其他组件 】
【 使用版本 】=4.1社区版
【问题描述】清晰明确描述问题
只配置两个node
执行:kubectl apply -f obcluster.yaml 命令
state:
waiting:
message: back-off 5m0s restarting failed container=obproxy pod=obproxy-67d76894c4-mbjmh_obcluster(343063bf-eaaa-40e0-b560-034dcf4d7cd4)
reason: CrashLoopBackOff
【复现路径】问题出现前后相关操作
【问题现象及影响】

【附件】obcluster.yaml
apiVersion: cloud.oceanbase.com/v1
kind: OBCluster
metadata:
name: ob-test
namespace: obcluster
spec:
imageRepo: oceanbasedev/oceanbase-cn
tag: v4.1.0.0-100000192023032010
imageObagent: oceanbase/obagent:1.2.0
clusterID: 1
topology:
- cluster: cn
zone:
- name: zone1
region: region1
nodeSelector:
ob.zone: zone1
replicas: 1
- name: zone2
region: region1
nodeSelector:
ob.zone: zone2
replicas: 1
parameters:
- name: log_disk_size
value: “20G”
resources:
cpu: 2
memory: 4Gi
storage:
- name: data-file
storageClassName: “local-path”
size: 20Gi
- name: data-log
storageClassName: “local-path”
size: 20Gi
- name: log
storageClassName: “local-path”
size: 10Gi
- name: obagent-conf-file
storageClassName: “local-path”
size: 1Gi
volume:
name: backup
nfs:
server: ${nfs_server_address}
path: /opt/nfs
readOnly: false

1 个赞

问题是执行了 k8s 的部署之后,node waiting状态吗?

volume:
name: backup
server: ${nfs_server_address}
path: /opt/nfs
readOnly: false

server 需要配置实际的ip地址。如果不需要备份,可以把volume配置删除。如果删除配置,则后续就无法进行备份。

nfs_server_address 配置哪台机器的IP,一个master,两个NODE机器

peding状态

Pending

我先去掉了 volume

${nfs_server_address} 需要配置你的部署了nfs client的机器ip。
可以参考这个文档:https://www.oceanbase.com/docs/common-oceanbase-database-cn-10000000001697198


我去掉了volume,我按照文档,准备了3个node,执行kubectl apply -f obcluster.yaml
node节点pod状态:pending,请问是什么问题

有为node打上label吗?
可以执行 kubectl get node -A --show-labels 查看一下


我之前标签有个重复了node02 也zone=1,我调整回来了,现在是data-file not found

现在的pod情况是怎么样的。因为一开始没有pvc的话是会warning然后会去执行创建,所以需要完整的看event。可以截图下现在的情况吗?
提供下obcluster、ob-operator 版本

pod是一直是pending中,obcluster 镜像版本:v4.1.0.0-100000192023032010,ob-operator是按照helm install ob-operator ob-operator/ob-operator --namespace=oceanbase-system --create-namespace --version=1.1.0 这个来按照,版本应该是1.1.10

1111。

需要describe ob的 pod 查看一下完整 event截图。
并且提供当前pod状态截图。
再提供一下 operator完整日志。
执行方式 :
kubectl describe ${pod_name} -n obcluster
kubectl get pods -n obcluster
kubectl logs ${pod_name} -n manager oceanbase-system