索引是一个排序的列表,包含索引字段的值和其对应的行记录的数据所在的物理地址
●索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。 ●使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。 ●索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。 ●索引是表中一列或者若干列值排序的方法。 ●建立索引的目的是加快对表中记录的查找或排序。
加快标的查询速度,还可以对字段进行排序 ●设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。 ●当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。 ●可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。 ●通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。 ●可以加快表与表之间的连接。 ●在使用分组和排序时,可大大减少分组和排序的时间。 ●建立索引在搜索和恢复数据库中的数据时能显著提高性能
没有索引的情况下,要根据条件查询某行数据时需要先扫描全表,再来定位某行数据
有了索引后,会先通过查询条件的字段值找到其索引对应的行记录的数据的物理地址,然后根据物理地址访问相应的行记录的数据,就像根据书目录的页码快速找到所需的内容。
索引需要占用额外的磁盘空间
更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间
1)表中的记录行数较多时创建索引,一般超过300行的表建议要有索引
2)建议在表中的主键字段、外键字段、多表连接使用的公共关键字段、唯一性较好的字段、不经常更新的字段、经常出现在where,group by,order by子语句的字段、小文本短字段上面创建索引。
3)不建议在唯一性较差的字段、更新太频繁的字段、大文本字段上创建索引。
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。 ●表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。 ●记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。 ●经常与其他表进行连接的表,在连接字段上应该建立索引。 ●唯一性太差的字段不适合建立索引。 ●更新太频繁地字段不适合创建索引。 ●经常出现在 where 子句中的字段,特别是大表的字段,应该建立索引。 ●在经常进行 GROUP BY、ORDER BY 的字段上建立索引; ●索引应该建在选择性高的字段上。 ●索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。
?用and做逻辑运算符字段查询时,要创建组合索引且要满足最左原则,用or做逻辑运算符多字段查询时,所有的字段都要单独创建单列索引
?支持模糊查询 select .... from 表名 where match(字段)against(‘单词’);
默认情况下只能识别英文的模糊查询,需要另外配置第三方插件
show create table 表名;
show index from 表名;
show keys from 表名;
drop index 索引名 on 表名; 直接删除索引
alter table 表名 drop index 索引名;修改表方式删除索引
alter table 表名 drop primary key; 删除主键索引
1)先使用 explain 分析 select 语句,看 key 字段,确定 select 语句是否使用了索引或索引使用是否正确
2)再根据 select 语句中 where 子语句使用的条件字段创建相应的单列索引或者组合索引,组合索引要满足最左原则
定义:事务就是一组数据库操作序列(包含一个或者多个SQL操作命令),事务会把所有的操作看做是一个不可分割的整体向数据库系统提交或撤销操作,所有操作要么都执行,要么都不执行。
事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令都作为一个整体一起洗那个系统提交或者撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
事务是一个不可分割的工作逻辑单元,在数据库上执行并发操作时,事物时最小的控制单元。
事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证卷交易系统等。
事务通过事务的整体性以保证数据的一致性。
事务能够提高在向表中更新和插入信息期间的可靠性
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应句白的几个特性
指事务是一个不可再分割的工作单元,事务中的操作要么都发生,要么都不发生。
事务是一个完整的操作,事务的个元素是不可分的。
事务中的所有元素必须作为一个整体提交或回滚。
如果事务中的任何元素失败,则整个事务都将失败。
A给B转帐100元钱的时候只执行了扣款语句,就提交了,此时如果突然断电,A账号已经发生了扣款,B账号却没收到加款,在生活中就会引起纠纷。这种情况就需要事务的原子性来保证事务要么都执行,要么就都不执行。
指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
当事务完成时,数据必须处于一致状态。
在事务开始前,数据库中存储的数据处于一致状态。
在正在进行的事务中,数据可能处于不一致的状态。
当事务成功完成时,数据必须再次回到已知的一致状态。
对银行转帐事务,不管事务成功还是失败,应该保证事务结束后表中A和B的存款总额跟事务执行前一致。
指在并发环境中,当不同的事务同时操控相同的数据时,每个事务都有各自的完整数据空间。
对数据进行修改的所有并发事务时批次隔离的,表明事务必须是独立的,他不应以任何方式依赖或影响其他事务。
修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这类数据。
也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,并发事务之间的数据库时独立的。
(1)脏读:当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。 (2)不可重复读:指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问该同一数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。(即不能读到相同的数据内容) (3)幻读:一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有一个没有修改的数据行,就好象发生了幻觉一样。 (4)丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
MySQL事务支持如下四种隔离,用以控制事务所做的修改,并将修改通告至其它并发的事务:
允许脏读,即允许一个事务可以看到其他事务未提交的修改,不可重复读、幻读。
允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。防止脏读。不允许脏读,允许不可重复读、幻读。
确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改。可以防止脏读和不可重复读。不允许脏读、重复读,有条件的允许幻读(InnoDB存储引擎可以不允许)。
完全串行化的读,将一个事务与其他事务完全地隔离。每次读都需要获得表级共享锁,读写相互都会阻塞。可以防止脏读,不可重复读取和幻读,(事务串行化)会降低数据库的效率。相当于表锁定,但是会影响数据库的读写效率和性能。
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed 。
● 全局级:对所有的会话有效 ● 会话级:只对当前的会话有效
show global variables like '%isolation%';(模糊查询,%代表0个1个或者多个字符)
SELECT @@global.tx_isolation;
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
set global transaction isolation level 隔离级别名称;可在所有会话有效,需要重新登录才可生效
set @@global.tx_isolation='read-committed'; #重启服务后失效
set session transaction isolation level 隔离级别名称;可在当前会话中立刻生效 set @@session.tx_isolation='repeatable-read';
在事务完成以后,该事务所对数据库所做的更改便持久的保存在数据库之中,并不会被回滚。
指不管系统是否发生故障,事务处理的结果都是永久的。
一旦事务被提交,事物的效果会被永久的保留在数据库中。
事务性操作:create database table insert into update XXX set delete from
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎。
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
MySQL数据库中的组件,负责执行实际的数据I/O操作(数据的存储和提取),存储引擎工作在文件系统之上,数据库的数据文件会先传输到存储引擎,再按照各个存储引擎的存储格式保存到文件系统中。
MyISAM InnoDB
不支持事务、外键约束,只支持表级锁定,适合单独的查询和插入的操作,读写会相互阻塞,支持全文索引,硬件资源占用较小,并且数据文件和索引文件是分开存储的。(存储成三个文件:表结构文件.frm、数据文件.MYD、索引文件.MYI)
使用场景:适用于不需要事务支持,单独的查询或者插入数据的业务场景
支持事务、外键约束,支持行级锁定(在全表扫描时仍然会表级锁定),读写并发能力较好,支持全文索引(5.5版本之后支持),InnoDB的缓存能力较好,可以减缓磁盘IO的压力,他的数据文件也是索引文件。(存储成两个文件:表结构文件.frm、数据文件.ibd)
使用场景:适用于需要事务支持,一致性要求较高,数据会频繁更新,读写并发高的业务场景。
.frm 文件存储表结构的定义
数据文件的扩展名为.MYD(MYData)
索引文件 扩展名.MYI(MYIndex)
表级锁定形式,数据在更新时锁定整个表
数据库在读写过程中相互阻塞
会在数据写入的过程阻塞用户数据的读取
也会在数据读取的过程中阻塞用户的数据写入
数据单独写入或读取,速度过程较快且占用资源相对较少
MyISAM支持的存储格式
静态表
动态表
压缩表
公司业务不需要事务的支持
单方面读取或者写入数据比较多的业务
MyISAM存储引擎数据读写都比较频繁场合不适合
使用读写并发访问相对较低的业务
数据修改相对较少的业务
对数据业务一致性要求不是非常高的业务
服务器硬件资源相对比较差
支持事务,支持4个事务隔离级别
MySQL从5.5.5版本开始,默认的存储引擎为InnoDB
读写阻塞与实物隔离级别相关
能非常高效的缓存索引和数据
表与主键以簇的方式存储
支持分区、表空间,类似oracle数据库
支持外键约束 ,5.5之前不支持全文索引,5.5后支持全文索引
对硬件资源要求还是比较高的场合
行级锁定,但是全表扫描仍然会是表级锁定,如
update table set a=1 where user like '%zhaang%';
InnoDB中不保存表的行数,如select count(*)from table;时,InnoDB需要扫描一遍整个表来计算有多少行,但是MyISAM只要简单的读出保存好的行数即可。需要注意的是,当count(**)语句包含where条件式MyISAM也需要扫描整个表
对于自增长的字段,InnoDB中必须包含只有该字段的索引,但是在MyISAM表中可以和其他字段一起建立组合索引
清空整个表时,InnoDB是一行一行的删除,效率非常的慢,MyISAM则会重建表。
业务需要事务的支持
行级锁定对高并发有很好的适应能力,但需要确保查询是通过索引来完成
业务数据更新较为频繁的场景(如论坛、微博等)
业务数据一致性要求较高(例如银行业务)
硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力
所有的引擎都支持通用的数据类型
但不是所有的引擎都支持其他的字段类型,如二进制对象
表锁定:MyISAM支持
行锁定:InnoDB支持
建立索引在搜索和回复数据库中的数据时能显著提高性能
不同的存储引擎提供不同的制作索引的技术
有些存储引擎根本不支持索引
提高在向表中更新和插入信息期间的可靠性
可根据企业业务是否要支持事务选择存储引擎
show create table 表名;
show table status [from 库名] where name=‘表名’\G;
show engines;
alter table 表名 engine=InnoDB/MyISAM; 针对已存在的表修改存储引擎
create table 表名 (....) engine=InnoDB/MyISAM; 新建表时指定存储引擎
vim /etc/my.cnf
[mysql]
default-storage-engine=InnoDB/MyISAM 设置新建表的默认存储引擎
死锁是指两个或多个事务在同一个资源上相互占用,并请求对方的锁定资源,从而导致恶性循环的现象。