Login
网站首页 > 文章中心 > 其它

【MySQL】索引和锁

作者:小编 更新时间:2023-09-29 14:09:12 浏览量:476人看过

前言

本文摘自数据库两大神器【索引和锁】

InnoDB存储引擎

索引

在之前,我对索引有以下的认知:

索引可以加快数据库的检索速度

表经常进行INSERT/UPDATE/DELETE操作就不要建立索引了,换言之:索引会降低插入、删除、修改等维护任务的速度.

索引需要占物理和数据空间.

了解过索引的最左匹配原则

知道索引的分类:聚集索引和非聚集索引

Mysql支持Hash索引和B+树索引两种

看起来好像啥都知道,but,但面试让你说的时候可能就GG了:

使用索引为什么可以加快数据库的检索速度啊?

为什么说索引会降低插入、删除、修改等维护任务的速度?

索引的最左匹配原则指的是什么?

Hash索引和B+树索引有什么区别?主流的使用哪一个比较多?InnoDB存储都支持吗?

聚集索引和非聚集索引有什么区别?

索引的基础知识

首先Mysql的基本存储结构是页(记录都存在页里边)

【MySQL】索引和锁

【MySQL】索引和锁

可以得出以下结论:

①?各个数据页可以组成一个双向链表

遍历双向链表,定位到所在的页

从所在的页内中查找相应的记录,因为不是根据主键查询,因而只能遍历

很明显,在数据量很大的情况下这样查找会很慢!

索引提高检索速度

通过上面可知,加快查找速度势在必行,那么,索引做了些什么可以让我们查询加快速度呢?其实就是将无序的数据变成有序(相对)

【MySQL】索引和锁

【MySQL】索引和锁

很明显的是:

没有用索引我们是需要遍历双向链表来定位对应的页,现在通过**"目录"**就可以很快地定位到对应的页上了!

其实底层结构就是B+树,B+树作为树的一种实现,能够让我们很快地查找出对应的记录.

【参考资料】:Mysql索引

索引降低增删改的速度

平衡树:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树.

B+树是平衡树的一种,是不会退化成链表的,树的高度都是相对比较低的(基本符合均衡的结构)【这样一来我们检索的时间复杂度就是O(logn)】!从上一节的图我们也可以

看见,建立索引实际上就是建立一颗B+树.

B+树是一颗平衡树,如果我们对这颗树增删改的话,那肯定会破坏它的原有结构.

要维持平衡树,就必须做额外的工作.正因为这些额外的工作开销,导致索引会降低增删改的速度

【参考资料】:B+树删除和修改

哈希索引

除了B+树之外,还有一种常见的是哈希索引.哈希索引就是采用一定的哈希算法,把键值换算成新的哈希值,检索时不需要类似B+树那样从根节点到叶子节点逐级查找,只

需一次哈希算法即可立刻定位到相应的位置,速度非常快.但是hash索引有好几个局限:

哈希索引也没办法利用索引完成排序

不支持最左匹配原则

不支持范围查询

【参考资料】:B+树索引和哈希索引的区别

InnoDB支持哈希索引嘛?

主流的还是使用B+树索引比较多,对于哈希索引,InnoDB是自适应哈希索引的(hash索引的创建由InnoDB存储引擎引擎自动优化创建,用户干预不了)!

聚集和非聚集索引

聚集索引就是以主键创建的索引

非聚集索引就是以非主键创建的索引

①?使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义

页内的记录是按照主键的大小顺序排成一个单向链表.

各个存放用户记录的页也是根据页中记录的主键大小顺序排成一个双向链表.

各个存放目录项的页也是根据页中记录的主键大小顺序排成一个双向链表.

我们把具有这两种特性的B+树称为聚集索引,所有完整的用户记录都存放在这个聚集索引的叶子节点处.这种聚集索引并不需要我们在MySQL语句中显式的去创建,

InnoDB存储引擎会自动的为我们创建聚簇索引.另外有趣的一点是,在InnoDB存储引擎中,聚集索引就是数据的存储方式(所有的用户记录都存储在了叶子节点),也

就是所谓的索引即数据.

非聚集索引也叫做二级索引

上边介绍的聚簇索引只能在搜索条件是主键值时才能发挥作用,因为B+树中的数据都是按照主键进行排序的.那如果我们想以别的列作为搜索条件该怎么办呢?难道

再建一棵B+树

索引优化

在执行SQL时,MySQL只能使用一个索引,会从多个单列索引中选择一个限制最为严格的索引,根据B+树的性质,很容易理解各种常见的MySQL索引优化思路

① 优先使用自增key作为主键

的空间占用增长也是极为恐怖的(如果二级索引使用主键定位数据行,则空间增长更加严重)

方面删除节点时发生节点合并的频率也较低

优化案例:

空间优化效果相当显著.

索引可以简单如一个列(a),也可以复杂如多个列(a, b, c, d),即联合索引.如果是联合索引,那么key也由多个列组成,同时,索引只能用于查找key是否存在(相等)

、<、between、like左匹配)等就不能进一步匹配了,后续退化为线性查找,也就是此时不会通过索引来查询

=、in自动优化顺序,mysql会自动优化这些条件的顺序

有索引列参与计算的查询条件对索引不友好(甚至无法使用索引).原因很简单,如何在节点中查找到对应key?如果线性扫描,则每次都需要重新计算,成本太高;如果二分

查找,则需要确定大小关系

如果已有索引(a),想建立索引(a, b),尽量选择修改索引(a)为索引(a, b).MySQL可以直接在索引a的B+树上,经过分裂、合并等修改为索引(a, b)

如果已有索引(a, b),则不需要再建立索引(a),但是如果有必要,则仍然需考虑建立索引(b).

count(*),表示字段不重复的比例,比例越大区分度越好.唯一键的区分度是1,而一些状态、性别字段可能在大数据面前的区分度趋近于0

【MySQL】索引和锁

锁的相关知识又跟存储引擎,索引,事务的隔离级别都是关联的

数据库锁知识

不少人在开发的时候,应该很少会注意到这些锁的问题,也很少会给程序加锁(除了库存这些对数量准确性要求极高的情况下),即使我们不会这些锁知识,我们的程序在一

般情况下还是可以跑得好好的.因为这些锁数据库隐式帮我们加了,只会在某些特定的场景下才需要手动加锁.

MyISAM在执行查询语句SELECT前,会自动给涉及的所有表加读锁,在执行增、删、改操作前,会自动给涉及的表加写锁,这个过程并不需要用户干预

表锁

首先要明确的是,用户很少手动加表锁

首先,从锁的粒度,我们可以分成两大类:

表锁

开销小,加锁快;不会出现死锁;锁定力度大,发生锁冲突概率高,并发度最低

行锁

开销大,加锁慢;会出现死锁;锁定粒度小,发生锁冲突的概率低,并发度高

不同的存储引擎支持的锁粒度是不一样的:InnoDB行锁和表锁都支持、MyISAM只支持表锁!InnoDB只有通过索引条件检索数据才使用行级锁,否则,InnoDB使用表

锁也就是说,InnoDB的行锁是基于索引的!

表锁下又分为两种模式:

表读锁(Table Read Lock)

表写锁(Table Write Lock)

从下图可以清晰看到,在表读锁和表写锁的环境下:读读不阻塞,读写阻塞,写写阻塞!

读读不阻塞:当前用户在读数据,其他的用户也在读数据,不会加锁

读写阻塞:当前用户在读数据,其他的用户不能修改当前用户读的数据,会加锁!

写写阻塞:当前用户在修改数据,其他的用户不能修改当前用户正在修改的数据,会加锁!

【MySQL】索引和锁

从上面已经看到了:读锁和写锁是互斥的,读写操作是串行.

如果某个进程想要获取读锁,同时另外一个进程想要获取写锁.在mysql中,写锁是优先于读锁的!

写锁和读锁优先级的问题是可以通过参数调节的:max_write_lock_count和low-priority-updates

注:

行锁

InnoDB和MyISAM有两个本质的区别:InnoDB支持行锁、InnoDB支持事务

InnoDB实现了以下两种类型的行锁:

共享锁(S锁、读锁):允许一个事务去读一行,阻止其他事务获得相同数据集的排他锁.即多个客户可以同时读取同一个资源,但不允许其他客户修改.

排他锁(X锁、写锁):允许获得排他锁的事务更新数据,阻止其他事务取得相同数据集的读锁和写锁.写锁是排他的,写锁会阻塞其他的写锁和读锁.

另外,为了允许行锁和表锁共存,实现多粒度锁机制,InnoDB还有两种内部使用的意向锁(Intention Locks),这两种意向锁都是表锁:

意向共享锁(IS):事务打算给数据行加行共享锁,事务在给一个数据行加共享锁前必须先取得该表的IS锁.

意向排他锁(IX):事务打算给数据行加行排他锁,事务在给一个数据行加排他锁前必须先取得该表的IX锁.

意向锁也是数据库隐式帮我们做了,不需要程序员关心!

MVCC

MVCC(Multi-Version Concurrency Control)多版本并发控制,可以简单地认为:MVCC就是行级锁的一个变种(升级版).在表锁中我们读写是阻塞的,基于提升并发性能

的考虑,MVCC一般读写是不阻塞的(很多情况下避免了加锁的操作).可以简单的理解为:对数据库的任何修改的提交都不会直接覆盖之前的数据,而是产生一个新的版本与

老版本共存,使得读取时可以完全不加锁.

事务的隔离级别

Read uncommitted:会出现脏读,不可重复读,幻读

Read committed:会出现不可重复读,幻读

Repeatable read:会出现幻读(Mysql默认的隔离级别,但是Repeatable read配合gap锁不会出现幻读!)

Serializable:串行,避免以上的情况

出现脏读的本质就是因为操作(修改)完该数据就立马释放掉锁,导致读的数据就变成了无用的或者是错误的数据

数据,B去修改数据库的数据,导致A多次查询数据库的结果都不一样【危害:A每次查询的结果都是受B的影响的,那么A查询出来的信息就没有意思了】

事务级别的快照!每次读取的都是当前事务的版本,即使被修改了,也只会读取当前事务版本的数据

如果还是不太清楚,我们来看看InnoDB的MVCC是怎么样的吧<<高性能MySQL>>

【MySQL】索引和锁

至于虚读(幻读):是指在一个事务内读取到了别的事务插入的数据,导致前后读取不一致.和不可重复读类似,但虚读(幻读)会读到其他事务的插入的数据,导致前后读取不

一致,幻读的重点在于新增或者删除 (数据条数变化),不可重复读的重点是修改,幻读和不可重复的区别?

乐观锁和悲观锁

同时候操作表A,过程如下:(模拟更新丢失,虽然不是很恰当)

使用Serializable隔离级别,事务是串行执行的!

乐观锁

悲观锁

我们使用悲观锁的话其实很简单(手动加行锁就行了):select * from xxxx for update,在select 语句后边加了for update 相当于加了排它锁(写锁),加了写锁以后,其

update A set Name=lisi,version=version+1 where ID=#{id} and version=#{version},此时即可避免更新丢失.

【参考资料】:什么是乐观锁和悲观锁

间隙锁GAP

间隙锁只会在Repeatable read隔离级别下使用

当我们用范围条件检索数据而不是相等条件检索数据,并请求共享或排他锁时,InnoDB会给符合范围条件的已有数据记录的索引项加锁;对于键值在条件范围内但并不存在

①.00 for update;

上面是一个范围查询,InnoDB不仅会对符合条件的empid值为101的记录加锁,也会对empid大于101(这些记录并不存在)的"间隙"加锁

为了防止幻读(上面也说了,Repeatable read隔离级别下再通过GAP锁即可避免了幻读)

满足恢复和复制的需要:MySQL的恢复机制要求在一个事务未提交前,其他并发事务不能插入满足其锁定条件的任何记录,也就是不允许出现幻读

死锁

并发的问题就少不了死锁,在MySQL中同样会存在死锁的问题

【参考资料】:MySQL死锁问题分析

【参考资料】:MySQL加锁处理分析

锁总结

表锁其实我们程序员是很少关心它的:

在MyISAM存储引擎中,当执行SQL语句的时候是自动加的.

在InnoDB存储引擎中,如果没有使用索引,表锁也是自动加的.

现在我们大多数使用MySQL都是使用InnoDB,InnoDB支持行锁:

在默认的情况下,select是不加任何行锁的~事务可以通过以下语句显示给记录集加共享锁或排他锁.

InnoDB基于行锁还实现了MVCC多版本并发控制,MVCC在隔离级别下的Read committed和Repeatable read下工作.MVCC实现了读写不阻塞

版权声明:倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本站《原创》内容,违者将追究其法律责任。本站文章内容,部分图片来源于网络,如有侵权,请联系我们修改或者删除处理。

编辑推荐

热门文章