DBA 入门教程(四)|揭秘数据迁移之 OceanBase CDC & OMS 社区版能力

在 DBA 入门教程第三期,我们介绍了如何完成一次高质量的 OceanBase 数据迁移,戳链接快速了解文字版。

DBA 入门教程第三期:如何完成一次高质量的 OceanBase 数据迁移

实战第一章:OceanBase 数据库概述

实战第二章:如何部署 OceanBase 社区版章节介绍

实战第三章:如何使用 OceanBase 社区版

针对上期直播内容,先来一波前情回顾, 未收看直播的小伙伴也可以参考以下课程笔记

  • 介绍了 MySQL 迁移 OceanBase 时的表结构迁移以及注意事项。说明:dbcat 表结构转换,是后续开源 OMS 工具的一个组件。

  • 介绍了 MySQLDUMP 常用导出命令和 DataX 常用的读写插件,以及如何使用 MySQLDUMP, DataX 将 MySQL 数据全量同步到 OceanBase。注意,OceanBase 读写插件在默认的二进制 DataX 包里不存在,需要编译安装后创建对应的目录并复制相关的 json 文件, 插件路径:target/datax/datax/plugin/reader[writer]/*reader[*writer]/plugin_job_template.json

  • 介绍了 Canal Server 和 Client 的工作原理,以及如何使用 Canal 将 MySQL 数据增量同步到 OceanBase。

对于数据迁移,还有疑问可至问答区 :OceanBase 社区

下面在和大家介绍一下DBA 入门教程第四期数据迁移之 OceanBase CDC & OMS 社区版能力介绍

提到 OceanBase CDC 能力,首先想知道的一定是它能帮我们解决哪些问题,以及我们为什么需要这种能力。此时,可以设想以下几个业务场景,不难感受到其重要性。

  1. 上 OceanBase 容易,下 OceanBase 也容易
    在行业中有句说法“上云容易下云难”,但 OceanBase 不存在这种现象。用户可以轻易通过 datax , canal ,(以及即将马上开源的 OMS )等功能将 MySQL 数据同步到 OceanBase ,同时 OceanBase CDC 提供将增量日志按事务提交顺序向外透出,供下游进行消费。如果数据在迁移到 OceanBase 后,我们还想做一个兜底的方案,OceanBase 可快速将数据同步至 MySQL ,以备回切的需要,让你用的放心。

  2. 一份数据,多维订阅
    使用 MySQL 时,企业内部可能还有大数据分析系统如 kafka 、Flink 等,通过解析 MySQL binlog(如 maxwell ,canal)等可以做到变更下游用户订阅感兴趣的数据表,来获取所需要的分析数据进行处理,不需要把分析流程嵌入到已有系统中,以实现解耦。现在 OceanBase 也提供了类似的能力,可以打通 OceanBase+oblogproxy+Canal+下游多维订阅者。

  3. 多集群数据同步
    OceanBase 提供“两地三中心”或者“三地五中心”等部署方案,但在跨地域部署的时候,网络延迟是一个不可忽略的问题。对于多数派的日志同步要求,在网络不太理想的情况下,多地部署方案可能并不太合适,企业版里还支持主备库等解决方案。那么在社区版用户中,有没有方法可以解决呢?现在我们可以通过 OceanBase CDC 这种能力自己来搭建多集群之间的数据同步,让我们的数据更有保障。

感兴趣的小伙伴可以扫描下方二维码进入交流群:

image