- Q1.DataX 同步任务可以暂停吗?
答:不支持暂停吧,可以设置跑前执行的sql,比如truncate table,彻底重新跑。
- Q2.DataX 的性能举例
答:(网友反馈)在8c,12g的虚拟机上,channel可以设置并发度32,7000万一张表,用了9分钟。
- Q3.不能对库整个库导入吗,例如表结构都一致,
答:支持的,可以配置多个表,但schema要一致。
- Q4.可以按视图view导出吗?
答:同步view可以写querysql 。
- Q5.原表无主键行吗?
答:无主键表可以同步,只是不能用“splitPK” 特性并行跑。
- Q6.支持多少 value , insert into table 后面跟多少个 value 值?
答:这个没有限制,但是通常不建议配置太大,默认值是2048,采用默认值或者配置256 ~ 1024都可以。
- Q7.内存瓶颈到了,可以减少write的 values 512 的值来解决吗?
答:ob写入的时候内存满了写入会停止(报错),等待内存降下来;ob内部会通过转储以释放内存。如果写入任务总是内存满,此时如果写入性能还不满足要求,那么要考虑增加ob租户的资源,主要是内存,以提高写入效率。降低batchSize 可能会降低写入速度,可能会减少内存满的概率。但不是根本解决方案。根本方法是 内存转储优化和内存扩容。
- Q8。老师,刚才监控是什么工具?
答:dooba。 具体使用见:https://mp.weixin.qq.com/s/gUBubuHqgxptf4DbdHcGyA 。
- Q9.目标库会写检查点么?
答:会写检查点,写在zk上,高可用使用zookeeper做的,故障切换后,还会回拨60秒,也可以自己指定。
- Q10.一个zone里添加一个server的时候 ,/bin/observer进程启动的时候-z 指定的名字要和已经存在的zone名一样吗?
答:首先集群名和rootservice_list 要保持一致。第二,zone名称要是目标zone(保持一致)。
- Q11.怎么查询集群名称呢?obd cluster list?
答:obd cluster list 里看到的 cluster_name 是obd部署时候自定义的,跟实际集群内部cluster_name 没有必然联系。请看前期 OBD 部署 的 视频 回放介绍。
- **Q12.**哪个视图可以获取到分区表的名称?
答: 无名:gv$partition 。