MySQL数据库InnoDB存储引擎中的锁机制

分享到

发布于2012-5-30

00 – 基本概念

当并发事务同时访问一个资源的时候，有可能导致数据不一致。因此需要一种致机制来将访问顺序化。

锁就是其中的一种机制。我们用商场的试衣间来做一个比喻。试衣间供许多消费者使用。因此可能有多个消费者同时要试衣服。为了避免冲突，试衣间的门上装了锁。试衣服的人在里边锁住，其他人就不能从外边打开了。只有里边的人开门出来，外边的人才能进去。

- 锁的基本类型

数据库上的操作可以归纳为两中，读和写。多个事务同时读一个对象的时候，是不会有冲突的。

同时读和写或者同时写才会产生冲突。因此为了提高并发性，通常定义两种锁：

A. 共享锁(Shared Lock) 也叫读锁.

共享锁表示对数据进行读操作。因此多个事务可以同时为一个对象加共享锁。

B. 排他锁(Exclusive Lock) 也叫写锁.

排他锁表示对数据进行写操作。如果一个事务对对象加了排他锁，其他事务就不能再给它加任何锁了。

- S、X锁的兼容性矩阵

对于锁，通常会用一个矩阵来描述他们之间的冲突关系。

S X

S + –

X - -

+ 代表兼容， -代表不兼容

- 锁的粒度

A. 表锁(Table Lock)

对整个表加锁，影响标准的所有记录。通常用在DDL语句中，如DELETE TABLE,ALTER TABLE等。

B. 行锁(Row Lock)

对一行记录加锁，只影响一条记录。通常用在DML语句中，如INSERT, UPDATE, DELETE等。

很明显，表锁影响整个表的数据，因此并发性不如行锁好。

- 意向锁（Intention Lock)

因为表锁覆盖了行锁的数据，所以表锁和行锁也会产生冲突。如:

A. trx1 BEGI

B. trx1 给 T1 加X锁，修改表结构。

C. trx2 BEGIN

D. trx2 给 T1 的一行记录加S或X锁（事务被阻塞，等待加锁成功)。

trx1要操作整个表，锁住了整个表。那么trx2就不能再对T1的单条记录加X或S锁，去读取或修这条记录。

为了方便检测表级锁和行级锁之间的冲突，就引入了意向锁。

A. 意向锁分为意向读锁(IS)和意向写锁(IX)。

B. 意向锁是表级锁，但是却表示事务正在读或写某一行记录，而不是整个表。

所以意向锁之间不会产生冲突，真正的冲突在加行锁时检查。

C. 在给一行记录加锁前，首先要给该表加意向锁。也就是要同时加表意向锁和行锁。

采用了意向锁后，上面的例子就变成了：

A. trx1 BEGIN

B. trx1 给 T1 加X锁，修改表结构。

C. trx2 BEGIN

D. trx2 给 T1 加IX锁（事务被阻塞，等待加锁成功)

E. trx2 给 T1 的一行记录加S或X锁.

- 表锁的兼容性矩阵

IS IX S X

IS + + + –

IX + + - -

S + - + -

X - - - -

+ 代表兼容， -代表不兼容

A. 意向锁之间不会冲突, 因为意向锁仅仅代表要对某行记录进行操作。在加行锁时，会判断是否冲突。

01 – 行锁

直观的理解，行锁就是要锁住一行记录，阻止其他事务操作该行记录。这里有一个隐含的逻辑:

A. 插入操作永远不会被阻止，因为插入操作不会操作一条存在的记录(这里不考虑Insert duplicate的处理)。这个逻辑是对的吗？这和用户的使用情况相关，有些情况下是用户能接受的，有些情况下是用户不能接受的。

- 幻读(Phantom Read)

如果不阻止INSERT操作，就会产生幻读.MySQL手册中有幻读的介绍.

A. MVCC 可以避免幻读.但是MVCC只对SELECT语句有效，对于SELECT … [LOCK IN SHARE MODE | FOR UPDATE], UPDATE, DELETE语句无效。

B. 为了能够通过锁避免幻读，采用了next-key的机制。next-key通过锁住2个记录之间的间隙，来阻止INSERT操作。

- 行锁的模式

行锁S、X锁上做了一些精确的细分，在代码中称作Precise Mode。这些精确的模式,使的锁的粒度更细小。可以减少冲突。

A. 间隙锁(Gap Lock),只锁间隙。

B. 记录锁(Record Lock) 只锁记录。

C. Next-Key Lock(代码中称为Ordinary Lock)，同时锁住记录和间隙.

D. 插入意图锁(Insert Intention Lock),插入时使用的锁。在代码中，插入意图锁，

实际上是GAP锁上加了一个LOCK_INSERT_INTENTION的标记.

MySQL手册对这些模式有详细的介绍.

- 行锁模式的兼容性矩阵

G I R N (已经存在的锁,包括等待的锁)

G + + + +

I - + + -

R + + - -

N + + - -

+ 代表兼容， -代表不兼容. I代表插入意图锁,

G代表Gap锁，I代表插入意图锁,R代表记录锁，N代表Next-Key锁.

S锁和S锁是完全兼容的，因此在判别兼容性时不需要对比精确模式。

精确模式的检测，用在S、X和X、X之间。

这个矩阵是从lock0lock.c:lock_rec_has_to_wait()的代码推出来的。从这个矩阵可以看到几个特点：

A. INSERT操作之间不会有冲突。

B. GAP,Next-Key会阻止Insert。

C. GAP和Record,Next-Key不会冲突

D. Record和Record、Next-Key之间相互冲突。

E. 已有的Insert锁不阻止任何准备加的锁。

同时也有几个疑问：

A. 为什么插入意图锁不阻止间隙锁？在特定的情况下会导致INSERT操作被无限期延迟。

B. 如果不阻止任何锁，这个锁还有必要存在吗？

- 目前看到的作用是，通过加锁的方式来唤醒等待线程。

- 但这并不意味着，被唤醒后可以直接做插入操作了。需要再次判断是否有锁冲突。

C. GAP+LOCK_INSERT_INTENTION标记的方式，能否直接变成INSERT_INTENTION锁？

目前还在看。

- B+Tree 行锁

InnoDB的行锁并不是简单的数据行锁的概念。而是指每个B+Tree上的行锁，也可以理解为每个Index上的行锁。因此操作一行记录时，有可能会加多个行锁在不同的B+Tree上。如:

CREATE TABLE t1(c1 INT KEY, c2 int, c3 int, INDEX(c2));

INSERT INTO t1 VALUES(1, 1, 1), (3, 3, 3)

UPDATE t1 c3 = 10 WHERE c2 <= 2

UPDATE语句会同时在Secondary Index和Clustered Index上加锁。

- 行锁模式的使用

行锁的这些模式都在什么情况下使用呢？ MySQL手册有详细的介绍。

A. Next-Key 使用在被WHERE条件用到的索引上（准确的说是用来做Search的索引上)。

上面的例子中，Index(c2)上使用 Next-Key Lock.

B. Record Lock使用在没有被WHERE条件使用的索引上。上面的例子中，簇索引上使用Record Lock.因此上面的UPDATE语句会同时在加Index(c2)的键1上加Next-Key,在主键1上加record锁。当另一个session并发插入(2,5,2),(3,5,2)时可以成功，但是(2,2,2)时会被阻塞。

Next-Key And Record

测试时发现，SELECT…[FOR UPDATE |LOCKIN SHARE MODE]可能会导致全部记录被锁住。

当表很小时，SELECT会采用全表扫描的方法。在使用这种方法时，遍历了所有的数据，因此所有数据都被锁住了。尽管对不符合条件的记录调用了ha_innobase::unlock_row(),但是在Repeatable Read级别时不会被释放。也许该算一个Bug.

C. A、B同时适用于SELECT…[FOR UPDATE | LOCK IN SHARE MODE]， UPDATE、DELETE语句。

D. GAP锁显然也是使用在WHERE条件使用的索引上。和Next-Key不同的是，GAP锁只加在上边界(第一个大于符合条件的记录)上。而Next-Key加在所有符合条件的记录上。上面例子中的条件c2=2的记录，需要在c2=3上加一个GAP锁。

？正向查询时，InnoDB中实际上在边界上加的是Next-Key锁。这可能是受实现的限制。

目前使用GAP情况有：

– Supremum记录上始终是一个GAP锁

– 反向查询(ORDER BY DESC)时.

– 等值匹配一个确切的键值时,对下一条记录加GAP锁。

– 等值匹配一个确切的键值的前缀时,对下一条记录加GAP锁。。

E. INSERT时，通常不加锁。只有当其他事务在插入点加了Gap或Next-key锁需要等待时，才会创建一个插入意图锁。这个锁是在waiting状态。

- 隔离级别对Next-Key锁的影响

A. Read Uncommitted和Read Committed时,不需要在间隙上加锁,Nexk-Key变成Record锁。

B. Repeatable Reads 和 Serializable时，通常情况下使用Next-key锁。

有2中情况不需要对间隙加锁:

– 查询一个唯一的值，如 WHERE c1 = 1, c1 是主键或唯一键，并且查询结果中不含NULL字段。

– 当innodb_locks_unsafe_for_binlog被开启。这里还是有一些值得思考的问题:

从这个情况来看，UPDATE，DELETE时加间隙锁完全是为了防止Master和Slave数据不一致。那么不使用binlog时就没有必要对DELETE, UPDATE加间隙锁。
Row Format Binlog时，不加间隙锁是否会引起Master, Slave不一至。
即便设置了innodb_locks_unsafe_for_binlog,SELECT…[]是否可以不加间隙锁。

判断加什么锁的主要工作在row0sel.c:row_search_for_mysql()中。

02 – 延迟加锁机制

如果一个表有很多的索引，那么操作一个记录时，岂不是要加很多锁到不同的B-Tree上吗？

先来看一个事务的状态信息:

CREATE TABLE t1(c1 INT KEY, c2 INT);

BEGIN;

INSERT INTO t1 VALUES(1, 1);

INSERT INTO t1 VALUES(2, 2);

SHOW ENGINE INNODB STATUS;

状态信息:

LIST OF TRANSACTIONS FOR EACH SESSION:

---TRANSACTION 501, ACTIVE 0 sec

1 lock struct(s), heap size 376, 0 row lock(s), undo log entries 2

– 隐式锁

Lock 是一种悲观的顺序化机制。它假设很可能发生冲突，因此在操作数据时，就加锁。

如果冲突的可能性很小，多数的锁都是不必要的。

Innodb 实现了一个延迟加锁的机制，来减少加锁的数量，在代码中称为隐式锁(Implicit Lock)。

隐式锁中有个重要的元素,事务ID（trx_id).隐式锁的逻辑过程如下：

A. InnoDB的每条记录中都一个隐含的trx_id字段，这个字段存在于簇索引的B+Tree中。

B. 在操作一条记录前，首先根据记录中的trx_id检查该事务是否是活动的事务(未提交或回滚).

如果是活动的事务，首先将隐式锁转换为显式锁(就是为该事务添加一个锁)。

C. 检查是否有锁冲突，如果有冲突，创建锁，并设置为waiting状态。如果没有冲突不加锁,跳到E。

D. 等待加锁成功，被唤醒，或者超时。

E. 写数据，并将自己的trx_id写入trx_id字段。Page Lock可以保证操作的正确性。