转储压缩方面还做了哪些优化?

转储、压缩方面,采用的是Size-Tiered/General Compression还是Leveled (Compression),亦或是混合的?除了两次压缩,RLE、字典等算法进行第一次压缩(4.0 据说新增自适应算法功能),lz4、ztsd等压缩算法做第二次压缩,还做了哪些优化?与同样使用压缩技术的 Oracle、MySQL 实例的存储总额相比,综合考虑多副本带来的多倍存储,压缩算法,LSM-Tree 的读、写、空间放大问题,以及 WAL、Redo、Paxos 等日志带来的额外存储开销,OB 有测试报告能证明存储总额较 Oracle、MySQL (最新GA版本) 有大幅提升吗?请详述并尽量提供证据链接,谢谢!

你可以动手测测,让大家开开眼 :stuck_out_tongue:

我做过 3.X 的 POC,同等硬件配置,SysBench、BenchMarkSQL、TPC-C、TPC-H 均不如MySQL 8.0 、Oracle 19C,TiDB也是一样。Oracle 、MySQL 部署的是一台专属单机数据库服务器,并没有集群化部署;OB、TiDB 和其他国产分布式数据库使用最小三副本三节点的集群模式,每个节点的硬件配置与前者相同。研发跟我硬解释说是数据量上来了就比单机数据库强了,而我测试的数据量已经够大了,感觉就是强行解释一波。