天啦撸超级麻烦的MySQL索引和数据引擎，快拿小本本记好

发布时间：2023年12月26日

1 MySQL的索引

1.1 索引

定义：

索引是一个排序的列表，包含索引字段的值和其对应的行记录的数据所在的物理地址

●索引是一个排序的列表，在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址（类似于C语言的链表通过指针指向数据记录的内存地址）。 ●使用索引后可以不用扫描全表来定位某行的数据，而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据，因此能加快数据库的查询速度。 ●索引就好比是一本书的目录，可以根据目录中的页码快速找到所需的内容。 ●索引是表中一列或者若干列值排序的方法。 ●建立索引的目的是加快对表中记录的查找或排序。

作用：

加快标的查询速度，还可以对字段进行排序 ●设置了合适的索引之后，数据库利用各种快速定位技术，能够大大加快查询速度，这是创建索引的最主要的原因。 ●当表很大或查询涉及到多个表时，使用索引可以成千上万倍地提高查询速度。 ●可以降低数据库的IO成本，并且索引还可以降低数据库的排序成本。 ●通过创建唯一性索引，可以保证数据表中每一行数据的唯一性。 ●可以加快表与表之间的连接。 ●在使用分组和排序时，可大大减少分组和排序的时间。 ●建立索引在搜索和恢复数据库中的数据时能显著提高性能

工作方式：

没有索引的情况下，要根据条件查询某行数据时需要先扫描全表，再来定位某行数据

有了索引后，会先通过查询条件的字段值找到其索引对应的行记录的数据的物理地址，然后根据物理地址访问相应的行记录的数据，就像根据书目录的页码快速找到所需的内容。

索引的副作用

索引需要占用额外的磁盘空间

更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间

1.2 创建索引的原则依据

1）表中的记录行数较多时创建索引，一般超过300行的表建议要有索引

2）建议在表中的主键字段、外键字段、多表连接使用的公共关键字段、唯一性较好的字段、不经常更新的字段、经常出现在where，group by，order by子语句的字段、小文本短字段上面创建索引。

3）不建议在唯一性较差的字段、更新太频繁的字段、大文本字段上创建索引。

索引虽可以提升数据库查询的速度，但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源，在有索引的情况下，数据库会先进行索引查询，然后定位到具体的数据行，如果索引使用不当，反而会增加数据库的负担。 ●表的主键、外键必须有索引。因为主键具有唯一性，外键关联的是主表的主键，查询时可以快速定位。 ●记录数超过300行的表应该有索引。如果没有索引，每次查询都需要把表遍历一遍，会严重影响数据库的性能。 ●经常与其他表进行连接的表，在连接字段上应该建立索引。 ●唯一性太差的字段不适合建立索引。 ●更新太频繁地字段不适合创建索引。 ●经常出现在 where 子句中的字段，特别是大表的字段，应该建立索引。 ●在经常进行 GROUP BY、ORDER BY 的字段上建立索引； ●索引应该建在选择性高的字段上。 ●索引应该建在小字段上，对于大的文本字段甚至超长字段，不要建索引。

1.3 索引的分类和创建

1）普通索引

最基本的索引类型，没有唯一性之类的限制。

直接创建索引：create index 索引名 on 表名（列名）；

(列名(length))：length是可选项，下同。如果忽略 length 的值，则使用整个列的值作为索引。如果指定，使用列的前 length 个字符来创建索引，这样有利于减小索引文件的大小。在不损失精确性的情况下，长度越短越好。 #索引名建议以“_index”结尾。

修改表方式创建索引：alter table 表名 add index 索引名（字段）

创建表的时候指定索引

2）唯一索引

与普通索引类似，但区别是唯一索引列的每个值都唯一。唯一索引允许有空值（注意和主键不同）。如果是用组合索引创建，则列值的组合必须唯一。添加唯一键将自动创建唯一索引。

直接创建唯一索引：create unique index 索引名 on 表名（列名）；

修改表方式创建索引：alter table 表名 add unique 索引名（列名）；

创建表时指定索引：create table 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));

3）主键索引

是一种特殊的唯一索引，必须指定为“PRIMARY KEY”。一个表只能有一个主键，不允许有空值。添加主键将自动创建主键索引。

创建表的时候指定：create table （[....]，primary key （列名））

修改表方式创建：alter table 表名 add primary key（字段）；

4）组合索引

可以是单列上创建的索引，也可以是在多列上创建的索引。需要满足最左原则，因为 select 语句的 where 条件是依次从左往右执行的，所以在使用 select 语句查询时 where 条件使用的字段顺序必须和组合索引中的排序一致，否则索引将不会生效。

craete index 索引名 on 表名（字段1，字段2，.....）；

alter table 表名 add index 索引名（字段1，字段2，...）；

create unique index 索引名 on 表名（字段1，字段2，....）；

alter table 表名 add unique 索引名（字段1，字段2，....）；

select .... from 表名 where 字段1=xx and 字段2=xx ...；

?用and做逻辑运算符字段查询时，要创建组合索引且要满足最左原则，用or做逻辑运算符多字段查询时，所有的字段都要单独创建单列索引

5）全文索引

适合在进行模糊查询的时候使用，可用于在一篇文章中检索文本信息。在 MySQL5.6 版本以前

FULLTEXT 索引仅可用于 MyISAM 引擎，在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。

create fulltext index 索引名 on 表名（字段）；

alter table 表名 add fulltext 索引名（字段）；

?支持模糊查询 select .... from 表名 where match（字段）against（‘单词’）；

默认情况下只能识别英文的模糊查询，需要另外配置第三方插件

查看索引

show create table 表名；

show index from 表名；

show keys from 表名；

删除索引

drop index 索引名 on 表名；直接删除索引

alter table 表名 drop index 索引名；修改表方式删除索引

alter table 表名 drop primary key；删除主键索引

1.4 在MySQL数据库中，如果遇到 select 语句查询速度慢该怎么办？

1）先使用 explain 分析 select 语句，看 key 字段，确定 select 语句是否使用了索引或索引使用是否正确

2）再根据 select 语句中 where 子语句使用的条件字段创建相应的单列索引或者组合索引，组合索引要满足最左原则

索引优化

2 事务介绍

2.1 事务的概念

定义：事务就是一组数据库操作序列（包含一个或者多个SQL操作命令），事务会把所有的操作看做是一个不可分割的整体向数据库系统提交或撤销操作，所有操作要么都执行，要么都不执行。

事务是一种机制、一个操作序列，包含了一组数据库操作命令，并且把所有的命令都作为一个整体一起洗那个系统提交或者撤销操作请求，即这一组数据库命令要么都执行，要么都不执行。
事务是一个不可分割的工作逻辑单元，在数据库上执行并发操作时，事物时最小的控制单元。
事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证卷交易系统等。
事务通过事务的整体性以保证数据的一致性。
事务能够提高在向表中更新和插入信息期间的可靠性

所谓事务，他是一个操作序列，这些操作要么都执行，要么都不执行，他是一个不可分割的工作单位。

2.2 事务的特性

ACID，是指在可靠数据库管理系统（DBMS）中，事务（transaction）应该具有四个特性：原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）、持久性（Durability）。这是可靠数据库所应句白的几个特性

原子性：

事务管理的基础。把事务中的所有操作看作是一个不可分割的工作单元，要么都执行，要么都不执行。

指事务是一个不可再分割的工作单元，事务中的操作要么都发生，要么都不发生。

事务是一个完整的操作，事务的个元素是不可分的。

事务中的所有元素必须作为一个整体提交或回滚。

如果事务中的任何元素失败，则整个事务都将失败。

案例：

A给B转帐100元钱的时候只执行了扣款语句，就提交了，此时如果突然断电，A账号已经发生了扣款，B账号却没收到加款，在生活中就会引起纠纷。这种情况就需要事务的原子性来保证事务要么都执行，要么就都不执行。

一致性：

事务管理的目的。保证事务开始前和事务结束后数据的完整和一致性。

指在事务开始之前和事务结束以后，数据库的完整性约束没有被破坏。

当事务完成时，数据必须处于一致状态。

在事务开始前，数据库中存储的数据处于一致状态。

在正在进行的事务中，数据可能处于不一致的状态。

当事务成功完成时，数据必须再次回到已知的一致状态。

案例：

对银行转帐事务，不管事务成功还是失败，应该保证事务结束后表中A和B的存款总额跟事务执行前一致。

隔离性：

事务管理的手段。使多个事务并发操作同一个表数据时，每个事务都有各自独立的数据空间，事务的执行不会受到其他事务的干扰。可通过设置隔离级别解决不同的一致性问题。

指在并发环境中，当不同的事务同时操控相同的数据时，每个事务都有各自的完整数据空间。

对数据进行修改的所有并发事务时批次隔离的，表明事务必须是独立的，他不应以任何方式依赖或影响其他事务。

修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据，或者在另一个使用相同数据的事务结束之后访问这类数据。

也就是说并发访问数据库时，一个用户的事务不被其他事务所干扰，并发事务之间的数据库时独立的。

//当多个客户端并发地访问同一个表时，可能出现下面的一致性问题：

（1）脏读：当一个事务正在访问数据，并且对数据进行了修改，而这种修改还没有提交到数据库中，这时，另外一个事务也访问这个数据，然后使用了这个数据。（2）不可重复读：指在一个事务内，多次读同一数据。在这个事务还没有结束时，另外一个事务也访问该同一数据。那么，在第一个事务中的两次读数据之间，由于第二个事务的修改，那么第一个事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的，因此称为是不可重复读。（即不能读到相同的数据内容）（3）幻读：一个事务对一个表中的数据进行了修改，这种修改涉及到表中的全部数据行。同时，另一个事务也修改这个表中的数据，这种修改是向表中插入一行新数据。那么，操作前一个事务的用户会发现表中还有一个没有修改的数据行，就好象发生了幻觉一样。（4）丢失更新：两个事务同时读取同一条记录，A先修改记录，B也修改记录（B不知道A修改过），B提交数据后B的修改结果覆盖了A的修改结果。

事务的隔离级别决定了事务之间可见的级别

MySQL事务支持如下四种隔离，用以控制事务所做的修改，并将修改通告至其它并发的事务：

（1）未提交读(Read Uncommitted（RU）)：

允许脏读，即允许一个事务可以看到其他事务未提交的修改，不可重复读、幻读。

（2）提交读(Read Committed（RC）)：

允许一个事务只能看到其他事务已经提交的修改，未提交的修改是不可见的。防止脏读。不允许脏读，允许不可重复读、幻读。

（3）可重复读(Repeatable Read（RR）)：---mysql默认的隔离级别

确保如果在一个事务中执行两次相同的SELECT语句，都能得到相同的结果，不管其他事务是否提交这些修改。可以防止脏读和不可重复读。不允许脏读、重复读，有条件的允许幻读（InnoDB存储引擎可以不允许）。

（4）串行读(Serializable)：---相当于锁表

完全串行化的读，将一个事务与其他事务完全地隔离。每次读都需要获得表级共享锁，读写相互都会阻塞。可以防止脏读，不可重复读取和幻读，(事务串行化)会降低数据库的效率。相当于表锁定，但是会影响数据库的读写效率和性能。

mysql默认的事务处理级别是 repeatable read ，而Oracle和SQL Server是 read committed 。

//事务隔离级别的作用范围分为两种：

● 全局级：对所有的会话有效 ● 会话级：只对当前的会话有效

查询全局事务隔离级别：

show global variables like '%isolation%';（模糊查询，%代表0个1个或者多个字符）

SELECT @@global.tx_isolation;

查询会话事务隔离级别：

show session variables like '%isolation%';

SELECT @@session.tx_isolation;

SELECT @@tx_isolation;

设置全局事务隔离级别：

set global transaction isolation level 隔离级别名称;可在所有会话有效，需要重新登录才可生效

set @@global.tx_isolation='read-committed'; #重启服务后失效

设置会话事务隔离级别：

set session transaction isolation level 隔离级别名称;可在当前会话中立刻生效 set @@session.tx_isolation='repeatable-read';

持久性

事务管理的结果。当事务被提交以后，事务中的命令操作的结果会被持久保存，且不会被回滚。

在事务完成以后，该事务所对数据库所做的更改便持久的保存在数据库之中，并不会被回滚。

指不管系统是否发生故障，事务处理的结果都是永久的。

一旦事务被提交，事物的效果会被永久的保留在数据库中。

总结：在事务管理中，原子性是基础，隔离性是手段，一致性是目的，持久性是结果。

2.3 事务的控制语句

begin或start transaction：显式的开启一个事物。

事务性操作：create database table insert into update XXX set delete from

commit或commit work：提交事务，并使已对数据库进行的所有修改变为永久性。

rollback或rollback work：回滚会结束用户的事务，并撤销正在进行的所有未提交的修改。

savepoint S1：使用savepoint 也允许在事务中创建一个回滚点，在一个事务中可以多个savepoint，S1代表回滚点名称。

rollback to XX:在事务中回滚到指定的回滚点位置。

2.4 使用set设置控制事务

set 会话级别（global/session） autocommit=0 禁止自动提交

set 会话级别（global/session） autocommit=1 开启自动提交，MySQL默认为1

show 会话级别（global/session） variables like ‘autocommit’ 查看MySQL中的autocommit值

3 MySQL存储引擎

MySQL中的数据用各种不同的技术存储在文件中，每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力，这些不同的技术以及配套的功能在MySQL中称为存储引擎。

存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式

MySQL数据库中的组件，负责执行实际的数据I/O操作（数据的存储和提取），存储引擎工作在文件系统之上，数据库的数据文件会先传输到存储引擎，再按照各个存储引擎的存储格式保存到文件系统中。

MySQL常用的存储引擎

MyISAM InnoDB

3.1 两种存储引擎的区别

MyISAM：

不支持事务、外键约束，只支持表级锁定，适合单独的查询和插入的操作，读写会相互阻塞，支持全文索引，硬件资源占用较小，并且数据文件和索引文件是分开存储的。（存储成三个文件：表结构文件.frm、数据文件.MYD、索引文件.MYI）

使用场景：适用于不需要事务支持，单独的查询或者插入数据的业务场景

InnoDB：

支持事务、外键约束，支持行级锁定（在全表扫描时仍然会表级锁定），读写并发能力较好，支持全文索引（5.5版本之后支持），InnoDB的缓存能力较好，可以减缓磁盘IO的压力，他的数据文件也是索引文件。（存储成两个文件：表结构文件.frm、数据文件.ibd）

使用场景：适用于需要事务支持，一致性要求较高，数据会频繁更新，读写并发高的业务场景。

3.2 MySQL的查询过程

3.3 MyISAM的特点

MyISAM不支持事务，也不支持外键约束，只支持全文索引，数据文件和索引文件是分开保存的。
访问速度快，对事物完整性没有要求
MyISAM适合查询、插入为主的应用
MyISAM在磁盘上存储成三个文件，文件名和表名都相同，但是扩展名分别为：

.frm 文件存储表结构的定义

数据文件的扩展名为.MYD（MYData）

索引文件扩展名.MYI（MYIndex）

表级锁定形式，数据在更新时锁定整个表
数据库在读写过程中相互阻塞

会在数据写入的过程阻塞用户数据的读取

也会在数据读取的过程中阻塞用户的数据写入

数据单独写入或读取，速度过程较快且占用资源相对较少
MyISAM支持的存储格式

静态表

动态表

压缩表

3.4 MyISAM适用的生产场景

公司业务不需要事务的支持
单方面读取或者写入数据比较多的业务
MyISAM存储引擎数据读写都比较频繁场合不适合
使用读写并发访问相对较低的业务
数据修改相对较少的业务
对数据业务一致性要求不是非常高的业务
服务器硬件资源相对比较差

3.5 InnoDB特点

支持事务，支持4个事务隔离级别
MySQL从5.5.5版本开始，默认的存储引擎为InnoDB
读写阻塞与实物隔离级别相关
能非常高效的缓存索引和数据
表与主键以簇的方式存储
支持分区、表空间，类似oracle数据库
支持外键约束，5.5之前不支持全文索引，5.5后支持全文索引
对硬件资源要求还是比较高的场合
行级锁定，但是全表扫描仍然会是表级锁定，如

update table set a=1 where user like '%zhaang%';

InnoDB中不保存表的行数，如select count（*）from table；时，InnoDB需要扫描一遍整个表来计算有多少行，但是MyISAM只要简单的读出保存好的行数即可。需要注意的是，当count（**）语句包含where条件式MyISAM也需要扫描整个表
对于自增长的字段，InnoDB中必须包含只有该字段的索引，但是在MyISAM表中可以和其他字段一起建立组合索引
清空整个表时，InnoDB是一行一行的删除，效率非常的慢，MyISAM则会重建表。

3.6 InnoDB适用的生产场景

业务需要事务的支持
行级锁定对高并发有很好的适应能力，但需要确保查询是通过索引来完成
业务数据更新较为频繁的场景（如论坛、微博等）
业务数据一致性要求较高（例如银行业务）
硬件设备内存较大，利用InnoDB较好的缓存能力来提高内存利用率，减少磁盘IO的压力

3.7 企业选择存储引擎的依据

需要考虑每个存储引擎提供了哪些不同的核心功能及应用场景
支持的字段和数据类型

所有的引擎都支持通用的数据类型

但不是所有的引擎都支持其他的字段类型，如二进制对象
锁定类型：不同的存储引擎支持不同级别的锁定

表锁定：MyISAM支持

行锁定：InnoDB支持
索引的支持

建立索引在搜索和回复数据库中的数据时能显著提高性能

不同的存储引擎提供不同的制作索引的技术

有些存储引擎根本不支持索引
事务处理的支持

提高在向表中更新和插入信息期间的可靠性

可根据企业业务是否要支持事务选择存储引擎

3.8 查看和修改存储引擎

查看存储引擎类型