flinkcdc抽取ob for oracle的nvarchar字段乱码

【 使用环境 】测试环境
【 OB or 其他组件 】OB or flinkcdc or obproxy
【 使用版本 】OB 3.2.2
【问题描述】

【复现路径】问题出现前后相关操作
【问题现象及影响】

【附件】

相关同学已经在github回复了,请关注一下

刚在 GitHub 上回复你了

您好:

  1. 我们使用的是flink-connector-oceanbase-cdc-2.3.0.jar
    2.目前参照官方的说明,可以直接读取oracle租户的增量数据,就是nvarchar遇到了问题,其他目前正常
    3.我们自己debug下看数据从obproxy出来,在反序列化之前已经是乱码

flink cdc 里的格式转换没有用 oracle 租户完整地测试过,目前看 nvarchar 的数据可能需要根据 NLS_NCHAR_CHARACTERSET 来读取,现有的代码里是统一用的 utf8,这个可能就是乱码的原因。

你可以在 flink cdc 的代码仓库建一个 issue,后续我会测试一下看看需要怎么调整。https://github.com/ververica/flink-cdc-connectors/issues

好的,我们自己刚用了utf16去接可以正常解析出中文

已创建issue,感谢支持
https://github.com/ververica/flink-cdc-connectors/issues/2114