vlambda
2020-09-17

mysql系列之InnoDB存储引擎结构详解

前言

InnoDB是Mysql数据库中最重要的存储引擎，搞清楚它的结构对理解它的各种机制的实现原理非常重要。今天和大家一起分享下InnoDB的结构。

一、InnoDB结构

由图可知：
InnoDB的底层结构主要由2部分组成：内存结构和磁盘结构。

二、内存结构详解

1、Buffer Pool

缓冲池是主内存中的一个区域，InnoDB在访问表和索引数据时会在其中进行缓存。缓冲池允许直接从内存中处理经常使用的数据，从而加快了处理速度。在专用服务器上，通常将多达80％的物理内存分配给缓冲池。
缓存的单位是页，使用LRU算法的变体将很少使用的数据从缓存中老化掉。

InnoDB的缓冲池缓存什么？有什么用？
缓存表数据与索引数据，把磁盘上的数据加载到缓冲池，避免每次访问都进行磁盘IO，起到加速访问的作用。

总结：
（1）缓冲池(buffer pool)是一种常见的降低磁盘访问的机制；
（2）缓冲池通常以页(page)为单位缓存数据，缓存最热的数据页(data page)与索引页(index page)；
（3）缓冲池的常见管理算法是LRU。memcache，OS，InnoDB都使用了这种算法；
（4）InnoDB对普通LRU进行了优化：

缓冲池使用最近最少使用（LRU）算法的变体对缓冲数据的列表进行管理。按照5:3的比例将Buffer pool空间划分成年轻代和老年代。
1、年轻代的头部是经常被访问的数据。
2、在老年代的尾部是很少被访问的数据。
什么时候需要一个空间向缓冲池中添加新页面时，删除老年代最近最少使用的页面（最尾部的页），并创建一个新页面添加到列表的中间。

2、Change Buffer

什么是InnoDB的写缓冲？
在MySQL5.5之前，叫插入缓冲(insert buffer)，只针对insert做了优化；现在对delete和update也有效，叫做写缓冲(change buffer)。

Change Buffer是缓存那些不在buffer pool里的辅助索引的变化的特殊数据结构。
在辅助索引发生改变时，如果辅助索引在buffer pool里面就会直接进行修改。如果发生变化的辅助索引页不在buffer pool里，则由Change Buffer先缓存这些辅助索引页的变更动作。等未来辅助索引页被读取时，再将数据再将数据合并(merge)恢复到缓冲池中的技术。写缓冲的目的是降低写操作的磁盘IO，提升数据库性能。

在内存中，Change Buffer是缓冲池的一个组成部分。在磁盘上，Change Buffer是system tablespace（系统表空间）的一部分，当数据库宕机时，索引的变更会被缓冲到磁盘的Change Buffer区域。

总结：
1、写缓冲只有在要修改的辅助索引页不在buffer pool内时，才会将写入操作缓存在change buffer
2、定期对写辅助索引页的changes buffer进行合并，写到到buffer pool 中
3、change buffer既包含内存结构，也包含磁盘结构。内存中的change buffer主要是缓冲辅助索引的变更操作，以便对变更操作进行合并，提高对辅助索引修改效率。
磁盘部分的change buffer主要是数据库宕机时，会将索引的变更缓冲到磁盘的Change Buffer区域。

为什么change buffer只对辅助索引生效？
以insert新增操作为例，插入顺序一般是按照主键递增顺序进行插入的，插入聚集索引（主键索引）一般是顺序的，不需要磁盘的随机读取。这种情况下对聚集索引的修改速度是非常快的，所以不需要进行写缓冲。
而对于辅助索引的插入或者更新操作，由于B+树的索引结构的特性决定了辅助索引插入的离散型。所以，对于辅助索引的插入或者更新操作，InnoDB中不是每一次都直接插入到索引页中，而是先判断插入的辅助索引页是否在缓存区中，若在直接插入；若不在，则先放入到change buffer中，然后再以一定频率和情况进行change buffer和辅助索引页子节点的merge（合并）操作，这时通常能将多个插入合并到一个操作中（因为在一个索引页中），这就大大提高了对于辅助索引插入的性能。

3、自适应hash索引（Adaptive Hash Index）

InnoDB存储引擎会监控对表上各索引页的查询，如果观察到建立hash索引可以提高查询速度，则自动建立hash索引。这就是自适应哈希索引（Adaptive Hash Index，AHI）
AHI是通过缓存池的B+树页构造而来，因此建立的速度很快，而且不需要对整张表构建hash索引。
InnoDB存储引擎会自动根据访问的频率和模式来自动的为某些热点也建立hash索引。

从这个层面上来说，InnoDB的自使用哈希索引，更像“索引的索引”，毕竟其目的是为了加速索引寻路。

AHI的要求：
1、对页连续访问的模式必须是一样的，即查询条件一样。
2、hash索引只能用来搜索等值的查询

4、Log Buffer

日志缓冲区是用于保存要写入磁盘上的日志文件数据的内存区域。
日志缓冲区大小由innodb_log_buffer_size变量定义，默认大小为16MB。日志缓冲区的内容定期刷新到磁盘。较大的日志缓冲区使大型事务可以运行，而无需在事务提交之前将redo日志数据写入磁盘。因此，如果您有更新，插入或删除许多行的事务，则增加日志缓冲区的大小可以节省磁盘I / O。
innodb_flush_log_at_trx_commit变量控制如何将日志缓冲区的内容写入并刷新到磁盘。innodb_flush_log_at_timeout变量控制日志刷新频率。

为什么要有 Log Buffer？
事务提交后，必须将事务对数据页的修改刷(fsync)到磁盘上，才能保证事务的ACID特性。
这个刷盘，是一个随机写，随机写性能较低，如果每次事务提交都刷盘，会极大影响数据库的性能。
日志缓冲区使大型事务可以运行，而无需在事务提交之前将redo日志数据写入磁盘，节省了磁盘I/O.

log buffer刷写的三种策略：

为了满足不用业务对于吞吐量与一致性的需求，MySQL事务提交时刷redo log有三种策略：innodb_flush_log_at_trx_commit
（1）0：每秒写入一次日志并将其刷新到磁盘。尚未刷新日志的事务可能会在崩溃中丢失。
（2）1：要完全符合ACID，必须使用默认设置1。日志在每次事务提交时写入并刷新到磁盘。
（3）2：日志在每次事务提交后写入，并每秒刷新一次到磁盘。尚未刷新日志的事务可能会在崩溃中丢失。
这里的写入都只是写入到系统的OS Cache中，如果不刷写到redo log中，数据可能在崩溃中丢失。

高并发业务，行业最佳实践，是使用第三种折衷配置（=2），这是因为：
（1）配置为2和配置为0，性能差异并不大，因为将数据从Log Buffer拷贝到OS cache，虽然跨越用户态与内核态，但毕竟只是内存的数据拷贝，速度很快；
（2）配置为2和配置为0，安全性差异巨大，操作系统崩溃的概率相比MySQL应用程序崩溃的概率，小很多，设置为2，只要操作系统不奔溃，也绝对不会丢数据。

高并发业务，行业内的最佳实践，是：
innodb_flush_log_at_trx_commit=2

总结

本文主要是介绍了InnoDB存储引擎的内部结构，对其中内存结构的各个组成部分进行了重点说明。
1、InnoDB引擎的结构分为内存结构和磁盘结构。
2、内存结构由缓冲池（Buffer Pool），写缓冲（Change Buffer），日志缓冲（ Log Buffer），自适应hash索引（Adaptive Hash Index）组成。
3、缓冲池（Buffer Pool）主要是缓存表数据与索引数据，加快访问速度。内部采用基于LRU算法的变体算法来管理缓存对象。
4、写缓冲（Change Buffer）主要是缓存辅助索引的更新操作，经过合并处理后定时刷写到磁盘上。
5、日志缓冲区（ Log Buffer）使大型事务可以运行，而无需在事务提交之前将redo日志数据写入磁盘，节省了磁盘I/O。注意事务提交时刷redo log有三种策略。

vlambda博客
学习文章列表

mysql系列之InnoDB存储引擎结构详解

一、InnoDB结构

二、内存结构详解

1、Buffer Pool

2、Change Buffer

3、自适应hash索引（Adaptive Hash Index）

4、Log Buffer

总结

标签:

推荐阅读

相关文章

阿里云服务器安装mysql数据库

看完上面的jvm调优，我们接着看mysql调优

SQL查询：Oracle、mysql、HQL查询语句差异

mysql应用实践-Navicat for MySQL工具定时自动备份mysql数据库

vlambda博客 学习文章列表

mysql系列之InnoDB存储引擎结构详解

一、InnoDB结构

二、内存结构详解

1、Buffer Pool

2、Change Buffer

3、自适应hash索引（Adaptive Hash Index）

4、Log Buffer

总结

标签:

推荐阅读

相关文章

阿里云服务器安装mysql数据库

看完上面的jvm调优，我们接着看mysql调优

SQL查询：Oracle、mysql、HQL查询语句差异

mysql应用实践-Navicat for MySQL工具定时自动备份mysql数据库

vlambda博客
学习文章列表