MVCC机制是怎么具体实现的?

sjdfwf · 2026 年6 月 11 日 09:30

MVCC机制是怎么具体实现的?

可可可 · 2026 年6 月 11 日 09:37

我也不理解

陈年旧Bug · 2026 年6 月 11 日 09:38

MVCC（多版本并发控制）机制的核心实现原理是通过保存数据在多个时间点的历史版本，使得读操作无需加锁即可读取到一致性的快照数据。它主要依赖以下三个关键组件协同工作：

隐式字段：每一行记录都包含两个隐藏字段。DB_TRX_ID 记录最后修改该行数据的事务ID；DB_ROLL_PTR 是一个回滚指针，指向该行数据在 Undo Log 中的上一个版本记录。
Undo Log 版本链：当对某行数据进行更新时，数据库不会直接覆盖原数据，而是将旧值写入 Undo Log，并通过 DB_ROLL_PTR 将这些不同版本的数据串联起来，形成一个从新到旧的“版本链”。
Read View：这是事务进行可见性判断的“快照视图”，它在事务启动或执行第一条 SELECT 语句时生成，包含四个核心字段：m_ids 表示生成 Read View 时所有活跃未提交事务的 ID 集合；min_trx_id 表示 m_ids 中的最小值；max_trx_id 表示生成 Read View 时系统即将分配的下一个事务 ID；creator_trx_id 表示创建该 Read View 的事务自身 ID。

当事务执行普通 SELECT（快照读）时，会从当前数据行的最新版本开始，沿着版本链逐个检查每个版本的 DB_TRX_ID：如果该版本的 DB_TRX_ID 小于 min_trx_id，说明该版本在 Read View 生成前已提交，数据可见；如果该版本的 DB_TRX_ID 大于等于 max_trx_id，说明该版本在 Read View 生成后才产生，数据不可见；如果该版本的 DB_TRX_ID 在 [min_trx_id, max_trx_id) 区间内，则需进一步判断其是否在 m_ids 中——若在，说明该事务尚未提交，数据不可见；若不在，说明该事务已提交，数据可见。

这一机制使得读写操作完全解耦，极大提升了高并发场景下的系统吞吐量，同时保证了事务隔离性。