MVCC
约 1473 字大约 5 分钟
2025-01-15
日志文件
redo log | undo log | bin log | |
---|---|---|---|
俗称 | 重做日志 | 回滚日志 | 二进制日志 |
内容 | 物理日志,记录事务中对数据的物理修改 | 逻辑日志,记录修改前的原始数据 | 记录所有执行增删改的SQL 语句,以及每个语句的执行时间 |
作用 | 确保事务持久性; 当事务提交时,MySQL会先将修改记录写入 redo log,并将其持久化到磁盘,即使数据库发生崩溃,可以通过 redo log 恢复已提交的事务 | 确保事务原子性; 用于数据回滚,同时可以提供多版本并发控制下的读(MVCC) | 主从复制 |
底层原理 | InnoDB存储引擎使用WAL(Write-Ahead Logging)机制,即先写日志,再写磁盘。每次事务提交时,InnoDB会先将Redo Log写入磁盘,然后再异步地将实际修改的数据写入磁盘 | InnoDB存储引擎会为每条记录维护一条Undo Log记录,并以链表的方式串联起来。如果事务需要回滚,MySQL会沿着Undo Log链表进行逐条回滚,直到恢复到事务开始时的状态 | MySQL在事务提交时将Binlog写入磁盘,确保数据的一致性和持久性。 |
1.MVCC定义
- MVCC,全名叫做多版本并发控制,允许多个事务同时对数据库进行读写操作,解决了一个数据的多版本读写冲突;传统的锁机制可以实现并发控制,但会导致阻塞和死锁等问题
- 核心思想:在数据库中,通过undo log维护多个数据版本,并根据事务的隔离级别来决定哪个版本数据对特定事务是可见的
- 实现的三个重要部分:
- 隐藏字段
- undo log版本链
- readView快照
- 隐藏字段:
- DB_ROW_ID:隐藏主键
- DB_TRX_ID:创建该undo log 数据的事务ID
- DB_ROLL_PTR:回滚指针,指向这个事务之前的 undo log
2.ReadView快照
补充:当前读VS快照读
当前读
- 读取的是当前记录的最新版本,读取的时候需要保证其他并发事务不能修改当前记录,对当前记录加锁
- 例子:Insert、Update、Delete、Select... for update(写锁)、Select... lock in share mode(读锁)
快照读:
- 最普通的Select查询SQL语句
- 读取的是数据的可见版本,有可能是历史数据、当前版本,不加锁,是非阻塞读
- 底层依赖:当执行“快照读”SQL语句时,依据ReadView(快照)来提取数据
ReadView,一个保存事务ID的list列表。记录的是本事务执行时,MySQL还有哪些事务在执行,且还没有提交
一种数据结构,包含四个字段:
- m_ids:当前活跃的事务编号集合
- min_trx_id:最小活跃事务编号
- max_trx_id:预分配事务编号,即当前最大事务编号+1
- creator_trx_id:ReadView创建者的事务编号
不同隔离级别下快照生成的时机:
- RC(读已提交):每一次select,都生成一个 ReadView
- RR(可重复读):开启一个事务之后,只有第一个select语句才会生成一张快照,此后读的都是快照中的数据,直到事务提交
- Serializable(可序列化):快照读退化成当前读(加锁,阻塞,读取到的是最新的数据)
根据ReadView快照访问undo log 版本链数据的规则:
- 若 该版本的创建事务id 等于 当前事务id ?可以访问该版本,因为数据是当前这个事务更改的;
- 若 该版本的创建事务id 小于 快照中 最小活跃事务编号?可以访问该版本,因为数据已经提交了;
- 若 该版本的创建事务id 大于 快照中 预分配事务id?不可以访问该版本,因为该事务修改的数据是在 ReadView生成后才开启的;
- 若 快照中最小活跃事务编号 <= 该版本的创建事务id <= 预分配事务id 并且 该版本的创建事务id不在活跃事务编号集合中,可以访问该版本,因为该数据已经提交;
3.举例
3.1 RC(读已提交)
- 其中事务4的两次快照读均会产生ReadView,如下:
- 分析第一个ReadView:
- 分析第二个ReadView:
小结:
- 在RC(读已提交)的事务隔离级别下,同一事务的两次快照读均会产生两个快照(ReadView);
- 第一个快照读读取的数据是 事务一修改并提交的数据:张三
- 第二个快照读读取的数据是 事务二修改并提交的数据:张小三
- 同一事务的两个不同select(快照读)读取的数据不一样,产生不可重复读现象
思考:应该怎么解决?
解决:设置隔离级别为 RR(可重复读),同一事务从始至终只会生成一个快照
3.2 RR(可重复读)
- 隔离级别为 RR(可重复读),同一事务从始至终只会生成一个快照,即不会产生 不可重复读问题
4.RR能解决幻读问题吗
结论:RR(可重复读)可以解决一部分幻读问题
原因:
同一事务的连续多次快照读,ReadView会产生复用,没有幻读问题
特例:当两次快照读之间存在当前读,ReadView会重新生成,导致幻读问题