vlambda博客
学习文章列表

大数据开发:关于MYSQL存储引擎详解


MySQL常用的存储引擎为MyISAM、InnoDB、MEMORY、ARCHIVE,其中InnoDB提供事务安全表,其他存储引擎都是非事务安全表



大数据开发:关于MYSQL存储引擎详解

1.MylSAM


ONE

MyISAM是MySQL的默认存储引擎。MyISAM不支持事务、也不支持外键,但其访问(读)速度快,对事务完整性没有要求。MyISAM除了提供ISAM里所没有的索引和字段管理的大量功能,MyISAM还使用一种表格锁定的机制,来优化多个并发的读写操作,其代价是你需要经常运行OPTIMIZE TABLE命令,来恢复被更新机制所浪费的空间。MyISAM还有一些有用的扩展,例如用来修复数据库文件的MyISAMCHK工具和用来恢复浪费空间的MyISAMPACK工具。使用这个存储引擎,每个MyISAM在磁盘上存储成三个文件。


(1)frm文件:存储表的定义数据

(2)MYD文件:存放表具体记录的数

(3)MYI文件:存储索引


frm和MYI可以存放在不同的目录下。MYI文件用来存储索引,但仅保存记录所在页的指针,索引的结构是B+树结构。下面这张图就是MYI文件保存的机制:

大数据开发:关于MYSQL存储引擎详解

从这张图可以发现,这个存储引擎通过MYI的B+树结构来查找记录页,再根据记录页查找记录。并且支持全文索引、B树索引和数据压缩。




大数据开发:关于MYSQL存储引擎详解

2.Innodb


TWO

与MyISAM引擎的索引结构同样也是B+Tree,但是Innodb的索引文件本身就是数据文件,即B+Tree的数据域存储的就是实际的数据,这种索引就是聚集索引。这个索引的key就是数据表的主键,因此InnoDB表数据文件本身就是主索引。



(1)InnoDB给Mysql提供了具有提交、回滚、和崩溃恢复能力的事物安全(ACID兼容)存储引擎。InnoDB锁定在行级并且也在SELECT语句中提供一个类似Oracle的非锁定读。这些功能增加了多用户部署和性能。在SQL查询中,可以自由地将InnoDB类型的表与其他Mysql的表的类型混合起来,甚至在同一个查询中也可以混合。


(2)InnoDB是为处理巨大数据量的最大性能设计。它的CPU效率可能是任何其他基于磁盘的关系数据库引擎所不能匹敌的。


(3)InnoDB存储引擎完全与Mysql服务器整合,InnoDB存储引擎为在主内存中缓存数据和索引而维持它自己的缓冲池。InnoDB将它的表和索引存在一个逻辑表空间中,表空间可以包含数个文件(或源磁盘分区)。这与MyISAM表不同,比如在MyISAM表中每个表被存在分离的文件中。InnoDB表可以是任何尺寸,即使在文件尺寸被限制为2GB的操作系统上。


(4)InnoDB支持外键完整性约束(FOREIGN KEY)。


(5)InnoDB被用在众多需要高性能的大型数据库站点上。


InnoDB不创建目录,使用InnoDB时,Mysql将在Mysql数据目录下创建一个名为ibdata1的10MB大小自动扩展数据文件,以及两个名为ib_logfile()和ib_fogfile1的5MB大小的日志文件。




大数据开发:关于MYSQL存储引擎详解

3.MEMORY/HEAP


THREE

MEMORY(又叫HEAP)存储引擎使用存在内存中的内容来创建表。每个MEMORY表只实际对应一个磁盘文件。MEMORY类型的表访问非常得快,因为它的数据是放在内存中的,并且默认使用HASH索引。但是一旦服务关闭,表中的数据就会丢失掉。HEAP允许只驻留在内存里的临时表格。驻留在内存里让HEAP要比ISAM和MYISAM都快,但是它所管理的数据是不稳定的,而且如果在关机之前没有进行保存,那么所有的数据都会丢失。


MEMORY主要用于那些内容变化不频繁的代码表,或者作为统计操作的中间结果表,便于高效地堆中间结果进行分析并得到最终的统计结果。它的主要特点:


(1)支持的数据类型有限制,比如:不支持TEXT和BLOB类型,对于字符串类型的数据,只支持固定长度的行,VARCHAR会被自动存储为CHAR类型;


(2)支持的锁粒度为表级锁。所以,在访问量比较大时,表级锁会成为MEMORY存储引擎的瓶颈;


(3)由于数据是存放在内存中,所以在服务器重启之后,所有数据都会丢失;


(4)查询的时候,如果有用到临时表,而且临时表中有BLOB,TEXT类型的字段,那么这个临时表就会转化为MyISAM类型的表,性能会急剧降低;




大数据开发:关于MYSQL存储引擎详解

大数据开发

大数据开发:关于MYSQL存储引擎详解

加米谷大数据





大数据开发:关于MYSQL存储引擎详解

4、ARCHIVE


FOUR

ARCHIVE存储引擎适合的场景有限,由于其支持压缩,故主要是用来做日志,流水等数据的归档,主要特点:


(1)支持Zlib压缩,数据在插入表之前,会先被压缩;


(2)仅支持SELECT和INSERT操作,存入的数据就只能查询,不能做修改和删除;


(3)只支持自增键上的索引,不支持其他索引;





FIVE

该如何选择合适的存储引擎

1、使用场景是否需要事务支持;

2、是否需要支持高并发,InnoDB的并发度远高于MyISAM;

3、是否需要支持外键;

4、是否需要支持在线热备;

5、高效缓冲数据,InnoDB对数据和索引都做了缓冲,而MyISAM只缓冲了索引;

6、索引,不同存储引擎的索引并不太一样;





个人技能提升|企业内训提升

成都高新区国际科技节能大厦B座23层