OB的LSM-Tree 架构和集中式数据库的B-Tree架构主要区别在是什么呢？

James-zhou · 2025 年10 月 21 日 14:12

OB的LSM-Tree 架构和集中式数据库的B-Tree架构主要区别都有哪些？

初学小菜鸡 · 2025 年10 月 21 日 14:13

底层结构:一个纯文本文件，其中每行包含一个key-value对

插入: 每次插入即追加新的内容到文件末尾，相同的值不会覆盖。

查询: 查看文件中最后一次出现的值来找到最新的值。

初学小菜鸡 · 2025 年10 月 21 日 14:14

最根本的区别在于它们的写入方式。B-Tree 采用 “原地更新” 模式，像修改Word文档一样，直接找到数据在磁盘上的位置进行覆盖，这导致大量随机I/O。而 LSM-Tree 采用 “追加写入” 模式，所有写入操作都先缓存在内存中，再批量、顺序地刷新到磁盘，形成多个不可变的数据文件。这种设计使得 LSM-Tree 的写入吞吐量远高于 B-Tree。
不同的写入方式带来了截然不同的性能特征。LSM-Tree 牺牲了部分读取性能以换取极高的写入吞吐量，因为一次查询可能需要检查多个数据文件。不过，它通过布隆过滤器等优化手段来缓解这个问题。此外，LSM-Tree 的不可变文件结构使其数据压缩效率极高，能显著降低存储成本。然而，其代价是严重的写放大和由后台压缩过程引起的性能抖动。相比之下，B-Tree 提供稳定且可预测的低延迟读写，读写性能较为均衡，但写吞吐是其瓶颈。
B-Tree 是读优化的架构，非常适合读写均衡、需要稳定响应时间的OLTP场景（如MySQL、PostgreSQL）。而 LSM-Tree 是写优化的架构，天生适合写密集型、对存储成本敏感且能容忍一定读取延迟和性能抖动的应用（如大数据存储、日志系统，代表数据库有Cassandra、HBase）。选择哪种架构，本质上是在写入吞吐、读取延迟、存储成本之间做出权衡。

淇铭 · 2025 年10 月 21 日 17:45

@论坛小助手

论坛小助手 · 2025 年10 月 21 日 17:46

OceanBase (OB) 使用的 LSM-Tree (Log-Structured Merge Tree) 架构与传统的集中式数据库所使用的 B-Tree 架构的主要区别在于以下几个方面：

写操作性能:
- LSM-Tree: 写操作性能更高。LSM-Tree 将数据先写入内存中的 MemTable，当 MemTable 达到一定大小时，会将其转储到磁盘上的 SSTable。由于写操作主要是追加操作，因此写性能非常高。
- B-Tree: 写操作需要频繁地进行平衡树的调整，涉及到磁盘的随机写操作，因此写性能相对较低。
读操作性能:
- LSM-Tree: 读操作需要合并内存中的 MemTable 和磁盘上的多个 SSTable，因此读操作可能涉及多次磁盘 I/O，读性能相对较差。为了提高读性能，LSM-Tree 通常会在内存中实现 Block Cache 和 Row Cache 来减少对磁盘的访问。
- B-Tree: 读操作性能较高，因为 B-Tree 中的数据是有序的，可以通过索引快速定位到数据所在的磁盘位置，减少磁盘 I/O 操作。
数据存储方式:
- LSM-Tree: 数据被分为基线数据和增量数据。基线数据存储在磁盘上的 SSTable 中，增量数据存储在内存中的 MemTable 中。当 MemTable 达到一定大小时，会触发转储操作，将数据写入 SSTable。定期还会进行合并操作，将多个 SSTable 合并成一个 SSTable。
- B-Tree: 数据直接存储在磁盘上的 B-Tree 结构中，每次写操作都会更新 B-Tree 的相应节点。
压缩和存储效率:
- LSM-Tree: 由于数据在转储和合并过程中可以进行高效的压缩，因此 LSM-Tree 在存储效率上表现更好，可以显著降低存储成本。
- B-Tree: B-Tree 的存储效率相对较低，因为每次写操作都需要更新索引，导致更多的磁盘空间占用。
适用场景:
- LSM-Tree: 更适合写密集型的应用场景，如日志系统、时间序列数据库等。
- B-Tree: 更适合读密集型的应用场景，如关系型数据库、OLTP 系统等。

总结来说，LSM-Tree 通过牺牲一定的读性能来换取更高的写性能和存储效率，而 B-Tree 则在读性能和写性能之间取得了更好的平衡。

详情请参考: