开发多用户、数据库驱动的应用,最大的一个难点是:一方面要最大程度的利用数据库的并发访问,另一方面还要确保每个用户能以一致的方式读取和修改数据。为此就有了锁的机制,同时这也是数据库系统区别于文件系统的一个关键特性。InnoDB存储引擎较之MySQL的其他存储引擎在这一方面技高一筹,其实现方式非常类似于Oracle数据库。而只有正确了解这些锁的内部机制才能充分发挥InnoDB存储引擎在锁方面的优势。
锁是数据库系统区别于文件系统的一个关键特性。锁机制用于管理对共享资源的并发访问。InnoDB存储引擎会在行级别上对表数据上锁,这固然不错。不过InnoDB存储引擎也会在数据库内部其他多个地方使用锁,从而允许对多种不同资源提供并发访问。例如:操作缓存池中的LRU列表,删除、添加、移动URL列表的元素,为了保证一致性,必须有锁的介入。数据库系统使用锁是为了支持对共享资源进行并发访问,提供数据的完整性和一致性。
另一点需要理解的是,虽然现在数据库系统做的越来越类似,但是有多少种数据库,就可能有多少种锁的实现方式。在SQL语法层面,因为SQL标准的存在,要熟悉多个关系数据库并不是一件难事。而对于锁,用户可能对某个特定的关系数据库系统的锁定模型有一定的经验,但这并不意味着知道其他数据库。
对于MyISAM引擎,其锁是表锁设计。并发情况下读没有问题,但是并发插入时的性能就要差一些,若插入是在底部,MyISAM存储引擎还是可以有一定的并发写入操作。
这里还要区分锁中容易令人混淆的概念lock与latch。在数据库中,lock与latch都可以被称为锁。但是两者有截然不同的含义。
latch一般称为闩锁(轻量级的锁)。在InnoDB存储引擎中,latch又可以分为mutex(互斥量)和rwlock(读写锁)。其目的是用来保证并发线程操作临界资源的正确性,并且通常没有死锁检测的机制。
lock的对象是事务,哟过来锁定的是数据库中的对象,如表、页、行。并且一般lock的对象仅在事务commit或rollback后进行释放(不同事务隔离级别释放的时间可能不同)。此外,lock,正如在大多数数据库中一样,是有死锁机制的。如下所示,介绍了lock与latch的不同。
lock | latch | |
---|---|---|
对象 | 事务 | 线程 |
保护 | 数据库内容 | 内存数据结构 |
持续时间 | 整个事务过程 | 临界资源 |
模式 | 行锁、表锁、意向锁 | 读写锁、互斥量 |
死锁 | 通过waits-for graph、time out等机制进行死锁检测与处理 | 无死锁检测与处理机制,仅通过应用程序加锁的顺序(lock leveling)保证无死锁的情况发生 |
存在于 | lock manager的哈希表中 | 每个数据结构的对象中 |
对于InnoDB存储引擎中的latch,可以通过命令show engine innodb mutex
来进行查看。
mysql> show engine innodb mutex;
+--------+-----------------------------+-----------+
| Type | Name | Status |
+--------+-----------------------------+-----------+
| InnoDB | rwlock: dict0dict.cc:2785 | waits=20 |
| InnoDB | rwlock: dict0dict.cc:2785 | waits=3 |
| InnoDB | rwlock: dict0dict.cc:2785 | waits=4 |
| InnoDB | rwlock: dict0dict.cc:1231 | waits=67 |
| InnoDB | rwlock: fil0fil.cc:1407 | waits=3 |
| InnoDB | rwlock: log0log.cc:846 | waits=491 |
| InnoDB | sum rwlock: buf0buf.cc:1474 | waits=48 |
+--------+-----------------------------+-----------+
7 rows in set (0.00 sec)
InnnoDB存储引擎实现了如下两种的行级锁:
如果一个事务T1已经获得了行r的共享锁,那么另外的事务T2可以立即获得r的共享锁。因为读取并没有改变行r的数据,称这种情况为锁兼容。但若有其他事务T3想获得行r的排他锁,则其必须等待事务T1、T2释放行r上的共享锁-这种情况称为锁不兼容。
X | S | |
---|---|---|
X | 不兼容 | 不兼容 |
S | 不兼容 | 兼容 |
如上表可看出,X锁和任何锁都不兼容,而S锁和S锁兼容。需要注意的是,S和X锁都是行锁,兼容是指对同一行锁的兼容性情况。
此外,InnoDB支持多粒度锁定,这种锁定允许事务在行级上锁和表级上得锁同时存在。为了支持不同力度进行加锁操作,innodb存储引擎支持一种额外得锁方式,称之为意向锁。意向锁是将锁定的对象分为多个层次,意向锁希望在更细粒度上枷锁。
InnoDB存储引擎支持意向锁设计比较简练,其意向锁即为表级别的锁,设计的目的主要是为了在一个事务中揭示下一行将被请求的锁类型。其支持两种意向锁:
1)意向共享锁(IS Lock),事务想要获得一张表中某几行共享锁
2)意向排他锁(IX Lock),事务想要获得一张表中某几行的排他锁
表级意向锁与行级锁的兼容性如下所示:
IS | IX | S | X | |
---|---|---|---|---|
IS | 兼容 | 兼容 | 兼容 | 不兼容 |
IX | 兼容 | 兼容 | 不兼容 | 不兼容 |
S | 兼容 | 不兼容 | 兼容 | 不兼容 |
X | 不兼容 | 不兼容 | 不兼容 | 不兼容 |
一致性的非锁定读是指InnoDB存储引擎通过行多版本控制的方式读取当前执行时间数据库中行的数据。如果读取的行正在执行delete或update操作,这时读取操作不会因此去等待行上锁的释放。相反的,InnoDB存储引擎会去读取行的一个快照数据。
快照数据是指该行之前版本的数据,该实现是通过undo段来完成。而undo用来在事务中回滚数据,因此快照数据本身没有额外的开销。此外,读取快照数据是不需要上锁的,因为没有事务需要对历史的数据进行修改。
默认配置下,即事务的隔离级别为repeatable read
模式下,InnoDB存储引擎的select操作使用一致性非锁定读。但是在某些情况下,用户需要显式的对数据库读取操作进行加锁以保证数据逻辑的一致性。而这要求数据库支持加锁语句,即使是对于select的只读操作。InnoDB存储引擎对于select语句支持两种一致性的锁定读(locking read)操作:
select ... for update
对读取的行加一个X锁,其他事务不能对已锁定的行加上任何锁。select ... lock in share mode
对读取的行记录加一个S锁,其他事务可以向被锁定的行加S锁,但是如果加X锁,则会被阻塞。
对于一致性非锁定锁,即使读取的行已被执行了select ... for update
,也是可以进行读取的,这和之前讨论的情况一样。此外,select ... for update,select ... lock in share mode
必须在一个事务中,当事务提交了,锁也就释放了。因此在使用上述两句select锁定语句时,务必加上begin,start transcation
或者set autocommit=0
。
自增长在数据库中是非常常见的一种属性,也是很多DBA或开发人员首选的主键方式。在InnoDB存储引擎的内存结构中,对每个含有自增长值得表都有一个自增长计数器。当对含有自增长得计数器得表进行插入操作时,这个计数器会被初始化,执行如下语句来得到计数器的值。
select max(auto_inc_col) from t for update;
插入操作会依据这个自增长的计数器值加1赋予自增长列。这个实现方式称作AUTO-INC Locking
。这种锁其实是采用一种特殊的表锁机制,为了提高插入的性能,锁不是在一个事务完成后才释放,而是在完成对自增长值插入的SQL语句后立即释放。
虽然AUTO-INC Locking
从一定程度上提高了并发插入的效率,但还存在一些性能上的问题。首先,对于有自增长值得列得并发插入性能较差,事务必须等待前一个插入的完成(虽然不用等待事务的完成)。其次,对于insert…select的大数据量的插入会影响插入性能,因为另一个事务中的插入会被阻塞。
外键主要用于引用完整性的约束检查。在InnoDB存储引擎中,对于一个外键列,如果没有显式的对这个列加索引,InnoDB存储引擎自动对其加一个索引,因为这样可以避免表锁-这比Oracle数据库做的好,Oracle数据库不会自动添加索引,用户必须自己手动添加,这也导致了Oracle数据库中可能产生死锁。
对于外键值得插入或更新,首先需要查询父表中的记录,即select父表。但是对于父表的select操作,不是使用一致性非锁定锁的方式,因为这样会发生数据不一致的问题,因此这时使用的是select ... lock in share mode
方式,即主动对父表加一个S锁。如果这时父表已经加X锁,子表操作会被阻塞。
InnoDB存储引擎有3种行锁的算法,其分别是:
record lock总是会去锁定索引记录,如果InnoDB存储引擎表在建立时没有设置任何一个索引,那么这时InnoDB存储引擎会使用隐式的主键进行锁定。
next-key lock是结合了gap lock和record lock的一种锁定算法,在next-key lock算法下,InnoDB对于行的查询都是采用这种行锁定算法。
在默认的事务隔离级别下,即repleatable read下,InnoDB存储引擎采用Next-Key Locking机制来避免幻读问题。这点可能不同于其他数据库,如Oracle数据库,因为其可能需要在serializable的事务隔离级别下才能解决幻读问题。
Phantom Problem是指在同一事务下,连续执行两次同样的SQL语句可能导致不同的结果,第二次的SQL语句可能会返回之前不存在的行。
通过锁定机制可以实现事务的隔离性要求,使得事务可以并发的工作。锁提高了并发,但是却会带来潜在的问题。不过好在因为事务隔离性的要求,锁只会带来三种问题,如果可以防止这三种情况的发生,那将不会产生并发异常。
在理解脏读之前,需要理解脏数据的概念。但是脏数据和之前所介绍的脏页完全是两种不同的概念。脏页指的是在缓冲池中已经被修改的页,但是还没有刷新到磁盘中,即数据库实例内存中的页和磁盘中的页的数据不一致,当然在刷新到磁盘之前,日志都已经被写入到重做日志文件中。而所谓脏数据是指事务对缓冲池中行记录的修改,并且还没有被提交。
对于脏页的读取,是非常正常的。脏页是因为数据库实例内存和磁盘的异步造成的,这并不影响数据的一致性(或者说两者最终会达到一致性,即当脏页都刷回到磁盘)。并且因为脏页的刷新是异步的,不影响数据库的可用性,因此可以带来性能的提高。
脏数据却截然不同,脏数据是指未提交的数据,如果读到了脏数据,即一个事务可以读到另一个事务中未提交的数据,则显然违反了数据库的隔离性。
不可重复读是指在一个事务内多次读取同一数据集合。在这个事务还没结束时,另外一个事务页访问该同一数据集合,并做了一些DML操作。因此,在第一个事务中的两个读数据之间,由于第二个事务的修改,那么第一个事务两次读到的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的情况,这种情况称为不可重复读。
丢失更新是另一个锁导致的问题,简单来说就是一个事务的更新操作会被另一个事务的更新操作所覆盖,从而导致数据的不一致。例如:
1)事务T1将行记录r更新为v1,但是事务T1并未提交。
2)与此同时,事务T2将行记录r更新为v2,事务T2未提交。
3)事务T1提交。
4)事务T2提交。
但是,在当前数据库的任何隔离级别下,都不会导致数据库理论意义上的丢失更新问题。这是因为,即使是read uncommited的事务隔离级别,对于行的DML操作,需要对行或其他粗粒度级别的对象加锁。因此在上述步骤2)中,事务T2并不能对行记录r进行更新操作,其会被阻塞,直到事务T1提交。
虽然数据库能阻止丢失更新问题的产生,但是在生产应用中还有另一个逻辑意义的丢失更新问题,而导致该问题的并不是数据库本身的问题。实际上,在所有多用户计算机系统环境下都有可能产生这个问题。简单来说,出现下面的情况时,就会发生丢失更新:
1)事务T1查询一行数据,放入本地内存,并显示给一个终端用户User1。
2)事务T2也查询该行数据,并将取得的数据显示给终端用户User2。
3)User1修改这行记录,更新数据库并提交。
4)User2修改这行记录,更新数据库并提交。
显然,这个过程用户User1的修改更新操作"丢失"了,而这个可能会导致巨大的影响。要避免丢失更新发生,需要让事务在这种情况下的操作变成串行化,而不是并行操作,即在上述四个步骤1)中,对用户读取的记录加上一个排他C锁。同样,在步骤2)操作过程中,用户同样也需要加一个排他X锁。通过这种方式,步骤2)就必须等待步骤1)和步骤3)完成,最后完成步骤4)。
因为不同锁之间的兼容性关系,在有些时刻一个事务中的锁需要等待另一个事务中的锁释放它所占用的资源,这就是阻塞。阻塞并不是一件坏事,其是为了确保事务可以并发正常地运行。
在InnoDB存储引擎中,参数innodb_lock_wait_timeout用来控制等待的时间(默认是50秒)。
mysql> select @@innodb_lock_wait_timeout;
+----------------------------+
| @@innodb_lock_wait_timeout |
+----------------------------+
| 50 |
+----------------------------+
1 row in set (0.00 sec)
参数Innodb_lock_wait_timeout是动态的,可以在MySQL数据库运行时进行调整:
mysql> set @@innodb_lock_wait_timeout=60;
Query OK, 0 rows affected (0.01 sec)
innodb_rollback_on_timeout用来设定是否在等待超时时对进行中的事务进行回滚操作(默认是OFF,代表不回滚)。而innodb_rollback_on_timeout是静态的,不可在启动时进行修改,如:
mysql> set @@innodb_rollback_on_timeout=on;
ERROR 1238 (HY000): Variable 'innodb_rollback_on_timeout' is a read only variable
死锁是指两个或两个以上的事务在执行过程中,因争夺资源而造成的一种互相等待的现象。
若无外力作用,事务都将无法推进下去。解决死锁问题最简单的方式是不要有等待,将任何的等待都转化为回滚,并且事务重新开始。毫无疑问,这的确可以避免死锁问题的产生。然而在线上环境中,这可能导致并发性能的下降,甚至任何一个事务都不能进行。而这所带来的问题比死锁问题更为严重,因为这很难被发现并且浪费资源。
解决死锁问题最简单的一种方法是超时,即当两个事务互相等待时,当一个等待时间超过设置某一阈值时,其中一个事务进行回滚,另一个等待的事务就能继续进行。在InnoDB存储引擎中,参数Innodb_lock_wait_timeout用来设置超时的时间。
超时机制虽然简单,但是其仅通过超时后对事务进行回滚的方式来处理,或者说其是根据FIFO的顺序选择回滚对象。但若超时的事务所占权重比较大,如事务操作更新了很多行,占用了较多的undo log,这时采用FIFO的方式,就显得不合适了,因为回滚这个事务的时间相对另一个事务的时间可能会很多。
因此,除了超时机制,当前数据库还普遍采用wait-for graph(等待图)的方式来进行死锁检测。较之超时的解决方案,这是一种更为主动的死锁检测方式。InnoDB存储引擎也采用的这种方式。wait-for graph要求数据库保存以下两种信息:
1)锁得信息链表
2)事务等待链表