vlambda博客
学习文章列表

MySQL索引、事务、存储引擎

一、MySQL索引

1、概念

索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。

索引是表中一列或者若干列值排序的方法。

建立索引的目的是加快对表中记录的查找或排序。

2、作用

●设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。

●当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。

●可以降低数据库的io成本,并且索引还可以降低数据库的排序成本。

●通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。

●可以加快表与表之间的连接。

●在使用分组和排序时,可大大减少分组和排序的时间。

●建立索引在搜索和恢复数据库中的数据时能显著提高性能

3、副作用

●索引需要占用额外的磁盘空间。

而 innodb 引擎的表数据文件本身就是索引文件。

●在插入和修改数据时要花费更多的时间,因为索引也要随之变动。

4、创建索引的原则依据

索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。

因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位

到具体的数据行,如果索引使用不当,反而会增加数据库的负担。

●表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是主表的主键,查询时可以快速定位。

●记录数超过300行的表应该有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。

●经常与其他表进行连接的表,在连接字段上应该建立索引。

●唯一性太差的字段不适合建立索引。

●更新太频繁地字段不适合创建索引。

●经常出现在where子句中的字段,特别是大表的字段,应该建立索引。

●在经常进行groupby(分组)、orderby(排序)的字段上建立索引 :

●索引应该建在选择性高的字段上。

●索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。

5、索引的分类与创建

create table member (id int (10),name varchar(10),cardid int(18),phone int(11),address varchar(50),remark text);

①、普通索引

最基本的索引类型,没有唯一性之类的限制。

●直接创建索引
create index 索引名 on 表名 (列名[(length)]);
# (列名(length)): length是可选项,下同。如果忽略length 的值,则使用整个列的值作为索引。如果指定,使用列的前length
个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。
#索引名建议以"_index" 结尾。

create index name_index on member (name);

●修改表方式创建
alter table 表名 add index 索引名 (列名);

●创建表的时候指定索引
create table 表名 ( 字段1 数据类型,字段2 数据类型[...], index 索引名 (列名));

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

②、唯一索引

与普通索引类似,但区别是唯-索引列的每个值都唯一。唯-索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。

●直接创建唯一索引:
create unique index 索引名 on 表名(列名);

create unique index cardid_index on member(cardid) ;

●修改表方式创建
alter table 表名 add unique 索引名 (列名);

●创建表的时候指定
create table 表名 (字段1 数据类型,字段2 数据类型[...],unique 索引名 (列名));

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

③、关键索引

是一种特殊的唯一索引, 必须指定为"primary key"。一个表只能有一个主键,不允许有空值。

添加主键将自动创建主键索引。

●创建表的时候指定
create table 表名 ([...],primary key (列名));

●修改表方式创建
alter table 表名 add primary key (列名) ;

alter table member add primary key (id) ;

MySQL索引、事务、存储引擎

④、组合索引

可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为select语句的where条件是依次从左往右执行的,所以在使用select语句查询时where条件使用的字段顺序必须和组合索引中的排序-致,否则索引将不会生效。

create table 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,index 索引名 (列名1, 列名2,列名3));

alter table 表名 add index 索引名 (列名1, 列名2,列名3);

select * from 表名 where 列名1='...' and 列名2='...' and 列名3='...';

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

⑤、全文索引

适合在进行模糊查询的时候使用,可用于在一-篇文章中检索文本信息。在mysql5.6版本以前ulltext索引仅可用于myisam引擎,在5.6版本之后innodb引擎也支持fulltext索引。全文索引可以在char. varchar或者text类型的列上创建。每个表只允许有一个全文索引。

●直接创建索引
create fulltext index 索引名 on 表名 (列名);

●修改表方式创建
alter table 表名 add fulltext 索引名 (列名);

alter table member add fulltext remark_index (remark) ;

●创建表的时候指定索引
create table 表名 (字段1 数据类型[,...],fulltext 索引名 (列名));
#数据类型可以为char、varchar或者text

●使用全文索引查询
select * from 表名 where match (列名) against('查询内容') ;

案例:
insert into member values (1,'zhangsan',123123,123123,'nanjing','this is member!');
insert into member values (2,'lisi',456456,456456,'beijing','this is vip!');
insert into member values (3,'wangwu',789789,78979,'shanghai','this is vip member!');
select * from member where match (remark) against('vip');

MySQL索引、事务、存储引擎

6、查看索引

show index from 表名;
show keys from 表名;

各字段的含义如下:
Table:表的名称。
Non_unique: 如果索引不能包括重复词,则为0:如果可以,则为1。
Key_name:索引的名称。
Seq_in_index:索引中的列序号,从1开始。
Column_name:列名称。
Collation:列以什么方式存储在索引中。在MySQL中,有值 'A’ (升序) 或 NULL (无分类)。
Cardinality:索引中唯一值数目的估计值。
Sub_part:如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为NULL.
Packed:指示关键字如何被压缩。如果没有被压缩,则为NULL。
Null:如果列含有NULL, 则含有YES。如果没有,则该列含有NO。
Index_type: 用过的索引方法(BTREE, FULLTEXT, HASH, RTREE) 。
Comment:备注。

MySQL索引、事务、存储引擎

7、删除索引

●直接删除索引  
drop index 索引名 on 表名;

●修改表方式删除索引
alter table 表名 drop index 索引名;

●删除主键索引
alter table表名 drop primary key;

MySQL索引、事务、存储引擎

二、MySQL事务

1、概念

●事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撒销操作请求,即这一组数据库命令要么都执行,要么都不执行。

●事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。

●事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。

●事务通过事务的整体性以保证数据的一致性。

●事务能够提高在向表中更新和插入信息期间的可靠性。

说白了,所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个可分割的工作单位。

2、ACID特点

ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity) 、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性。

原子性

指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。

事务是一个完整的操作,事务的各元素是不可分的。

事务中的所有元素必须作为一个整体提交或回滚。

如果事务中的任何元素失败,则整个事务将失败。

案例:

A给B转帐100元钱的时候只执行了扣款语句,就提交了,此时如果突然断电,A账号已经发

生了扣款,B账号却没收到加款,在生活中就会引起纠纷。这种情况就需要事务的原子性来

保证事务要么都执行,要么就都不执行。

一致性

指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。

当事务完成时,数据必须处于一致状态。

在事务开始前,数据库中存储的数据处于一致状态。

在正在进行的事务中,数据可能处于不一致的状态。

当事务成功完成时,数据必须再次回到已知的一致状态 。

案例:

对银行转帐事务,不管事务成功还是失败,应该保证事务结束后表中A和B的存款总额跟事务执行前一致。

隔离性

指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。

对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。

修改数据的事务可在另 - 一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。

也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的。

持久性

指不管系统是否发生故障,事务处理的结果都是永久的

在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。

一旦事务被提交,事务的效果会被永久地保留在数据库中。

总结:在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果。

当多个客户端并发地访问同一个表时,可能出现下面的一致性问题:

( 1 ) 脏读 : 一个事务读取了另一个事务未提交的数据,而这个数据是有可能回滚的。

 ( 2 ) 不可重复读 : 一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。

 ( 3 ) 幻读 : 一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有没有修改的数据行,就好象发生了幻觉一样。

( 4 ) 丢失更新 : 两个事务同时读取同一条记录,A先修改记录,B也修改记录 ( B不知道A修改过 ) ,B提交数据后B的修改结果覆盖了A的修改结果。

MySQL事務支持如下四种隔离,用以控制事务所做的修改,并将修改通告至其它并发的事务:

(1)未提交读(Read Uncommitted):
允许脏读,即允许一个事务可以看到其他事务未提交的修改。

(2)提交读(Read Committed(RC)):
允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。

(3)可重复读(Repeated Read(RR)): -----mysql默认的隔离级别
确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改。

(4)串行读(Serializable): -----相当于锁表
完全串行化的读,将一个事务与其他事务完全地隔离。每次读都需要获得表级共享锁,读写相互都会阻塞。

mysql默认的事务处理级别是repeatable read,而Oracle和SQL Server是read comnitted

事务隔离级别的作用范围分为两种:

●全局级:对所有的会话有效
●会话级:只对当前的会话有效

查询全局事务隔离级别:
show global variables like '%isolation%';
select @@global.tx_isolation;

查询会话事务隔离级别:
show session variables like '%isolation%';
select @@session.tx_isolation;
select @@tx_isolation;

设置全局事务隔离级别:
set global transaction isolation level read committed;

设置会话事务隔离级别:
set session transaction isolation level read committed;

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

3、事务控制语句

begin或starttransaction : 显式地开启一个事务。

commit或commitwork : 提交事务,并使已对数据库进行的所有修改变为永久性的。

rollback或rollbackwork : 回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。

savepoints1 : 使用savepoint允许在事务中创建一个回滚点,一个事务中可以有多个savepoint : “s1"代表回滚点名称。

rollbackto [ savepoint ] s1 : 把事务回滚到标记点。

案例:

use kgc;
create table account (
id int(10) primary key not null,
name varchar(40),
money double
);

insert into account values(1,'A',1000);
insert into account values(2,'B',1000);

MySQL索引、事务、存储引擎

测试提交事务

begin;
update account set money= money - 100 where name='A';
commit;
quit

mysql -u root -P
use kgc;
select * from account;

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

测试回滚事务

begin;
update CLASS set money= money + 100 where name='A';
select * from CLASS;

rollback;
quit
mysql -u root -p
use SCHOOL;
select * from CLASS;

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

测试多点回滚事务

begin;
update CLASS set money= money + 100 where name='A';
select * from CLASS;
SAVEPOINT S1;
update CLASS set money= money + 100 where name='B';
select * from CLASS;
SAVEPOINT S2;
insert into CLASS values(3,'C',1000);

select * from CLASS;
ROLLBACK TO S1;
select * from CLASS;

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

4、set设置事务

set autocommit=0;                              #禁止自动提交
set autocommit=1; #开启自动提交,mysq1默认为1
show variables like 'autocommit'; #查看mysq1中的autocommit值

如果没有开启自动提交,当前会话连接的mysq1的所有操作都会当成一个事务直到你输入rollback | commit;当前事务才算结束。
当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。
如果开起了自动提交,mysql 会把每个sq1语句当成一个事务, 然后自动的commit.
当然无论开启与否,begin; commit 或 rollback;都是独立的事务。

三、存储引擎

1、概念

MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎

存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式;

MySQL常用的存储引擎:MyISAM、InnoDB ;

MySQL数据库中的组件,负责执行实际的数据I / O操作 ;

MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储

2、MyISAM的特点

MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的

访问速度快,对事务完整性没有要求

MyISAM适合查询、插入为主的应用

MyISAM在磁盘 . 上存储成三个文件,文件名和表名都相同,但是扩展名分别为 :

. frm文件存储表结构的定义

数据文件的扩展名为 . MYD ( MYData )

索引文件的扩展名是 . MYI ( MYIndex )

表级锁定形式,数据在更新时锁定整个表

数据库在读写过程中相互阻塞

会在数据写入的过程阻塞用户数据的读取

也会在数据读取的过程中阻塞用户的数据写入

数据单独写入或读取,速度过程较快且占用资源相对少

MyIAM支持的存储格式

1.MyISAM表支持3种不同的存储格式:

(1)静态(固定长度)表

静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常

迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。

(2)动态表

动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定

期执行OPTIMIZE TABLE语句或myisamchk -r命令来改善性能,并且出现故障的时候恢复相对比较困难。

(3)压缩表

压缩表由myisamchk工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。

2、生产场景

①、单方面读取或写入数据比较多的业务

②、MyISAM存储弓 | 擎数据读写都比较频繁场景不适合

③、使用读写并发访问相对较低的业务

④、数据修改相对较少的业务

⑤、对数据业务 - 致性要求不是非常高的业务

⑥、服务器硬件资源相对比较差

3、InnoDB特点介绍

支持事务,支持4个事务隔离级别

MySQL从5 .5.5 版本开始,默认的存储引擎为InnoDB

读写阻塞与事务隔离级别相关

能非常高效的缓存索引和数据

表与主键以簇的方式存储

支持分区、表空间,类似oracle数据库

支持外键约束,5 .5 前不支持全文索引,5 .5 后支持全文索引

对硬件资源要求还是比较高的场合

行级锁定,但是全表扫描仍然会是表级锁定,如

updatetableseta = 1 whereuserlike "%zhang%';

InnoDB中不保存表的行数,如select count ( * ) fromtable ; 时InnoDB需要扫描一遍整个表来计算有多少行,但是MyISAM只要简单的读出保存好的行数即可。需要注意的是当count ( * ) 语句包含where条件时MyISAM也需要扫描整个表

对于自增长的字段,InnoDB中必须包含只有该字段的索引,但是在MyISAM表中可以和其他字段一起建立组合索引

清空整个表时,InnoDB是一行一行的删除,效率非常慢。MyISAM则会重建表

4、生产场景

①、业务需要事务的支持

 ②、行级锁定对高并发有很好的适应能力,但需确保查询是通过索引来完成

③、业务数据更新较为频繁的场景如 : 论坛,微博等

 ④、业务数据一致性要求较高如 : 银行业务

⑤、硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力

5、企业选择引擎依据

索引的支持

建立索引 | 在搜索和恢复数据库中的数据时能显著提高性能

不同的存储引擎提供不同的制作索引的技术

有些存储引擎根本不支持索引

事务处理的支持

提高在向表中更新和插入信息期间的可靠性

可根据企业业务是否要支持事务选择存储引擎

6、引擎控制语句

#查看系统支持的存储引擎
show engines;

#查看表使用的存储引擎
方法一:
show table status from 库名 where name='表名'\G

方法二:
use 库名;
show create table 表名;

#修改存储引擎
1.通过alter table 修改
use 库名;
alter table 表名 engine=MyISAM;

2.通过修改/etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim /etc/my.cnf
......
[mysq1d]
......
default-storage-engine=INNODB

systemctl restart mysql.service
注意:此方法只对修改了配置文件并重启mysq1服务后新创建的表有效,已经存在的表不会有变更。

3.通过create table 创建表时指定存储引擎
use 库名;
create table 表名 (字段1 数据类型,...) engine=MyISAM;

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

MySQL索引、事务、存储引擎

InnoDB行锁与索引的关系

InnoDB行锁是通过给索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来对记录加锁。

1)
delete from t1 where id=1;
如果id字段是主键,innodb对 于主键使用了聚簇索引,会直接锁住整行记录。

2)
delete from t1 where name='aaa' ;
如果name字段是普通索引,会先锁住索引的两行,接着会锁住相应主键对应的记录。

3)
delete from t1 where age=23;
如果age字段没有索引,会使用全表扫描过滤,这时表上的各个记录都将加上锁。

四、死锁

死锁一般是事务相互等待对方资源,最后形成环路造成的。

案例:
create table t1 (id int primary key,name char(3),age int);
insert into t1 values(1,'aaa',22);
insert into t1 values(2,'bbb',23);
insert into t1 values(3,'aaa',24);
insert into t1 values(4,'bbb',25);
insert into t1 values(5,'ccc',26);
insert into t1 values(6,'zZz',27);


session 1 session 2
begin; begin;
delete from t1 where id=5;
select * from t1 where id=1 for update;
delete from t1 where id=1; #死锁发生
update t1 set name='qqqq' where id=5; #死锁发生

#for update 可以为数据库中的行上一个排它锁。当一个事务的操作未完成时候,其他事务可以读取但是不能写入或更新。

如何尽可能避免死锁

1、以固定的顺序访问表和行。

2、 大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小。

3、在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。

4、降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁。

5、为表添加合理的索引。如果不使用索引将会为表的每一行记录添加上锁,死锁的概率大大增大。