vlambda博客
学习文章列表

MySQL的数据库引擎InnoDB索引实现详解

最近看到很多同学回复关键词MySQL数据库,看来想要学习这方面的课程,所以小艾同学这次就专门整理了合集,你们回复关键词“mysql或者MySQL”就可以看到了,今天再为大家更新一篇关于MySQL数据库引擎InnoDB索引实现的教程,欢迎大家一起学习交流!


关于这节课将分为四大篇章讲解



1. InnoDB 采用 B+Tree这种数据结构来实现 B-Tree索引。

2. 为什么MySQL选择B+树做索引:

3. B+ 树的三个特点:

3. B+ 树的三个优点:


一、InnoDB 采用 B+Tree这种数据结构来实现 B-Tree索引



InnoDB 存储引擎采用“聚集索引”的数据存储方式实现B-Tree索引。

聚集的定义:数据行的物理顺序与列值(一般是主键的那一列)的逻辑顺序相同,一个表中只能拥有一个聚集索引。


二. 为什么MySQL选择B+树做索引:

常见的数据库索引有下面三种类型:

第一是哈希表

第二种则是数组索引

与上述的哈希表类似,但又有所不同。与哈希索引类似,数组索引的效率也是非常高的,在一个有序数组里面去查找元素,我们只要进行二分查找即可。但是数组索引的问题也是非常地明显,那便是插入非常的麻烦,你插入一个新的元素,就要把后面所有的元素都往后移动一下。所以,数组索引我们一般只有静态数据才会使用。

第三种:二叉树

有序数组都讲了,那么接下来肯定就是二叉树了,我们说的二叉树当然是二叉排序树,二叉排序树相对与数组,最大的优点是方便插入。但是同时也存在这么一个问题,因为索引的数据可能存在磁盘,那么如果索引的数据超过1000条的时候,就有可能要经过10次才能够找到最终的数据,而磁盘IO的瓶颈在于寻道跟旋转,效率必然会降低。所以,我们要尽量地减少在磁盘中寻道跟旋转的次数,所以多叉树就被广泛应用在数据库索引当中了。而在多叉树中,最常被使用的,便是B+树。

三. B+ 树的三个特点:

  • 关键字数和子树相同

  • 非叶子节点仅用作索引,它的关键字和子节点有重复元素

  • 叶子节点用指针连在一起

首先第一点不用特别介绍了,在 B 树中,节点的关键字用于在查询时确定查询区间,因此关键字数比子树数少一;而在 B+ 树中,节点的关键字代表子树的最大值,因此关键字数等于子树数。

第二点,除叶子节点外的所有节点的关键字,都在它的下一级子树中同样存在,最后所有数据都存储在叶子节点中。根节点的最大关键字其实就表示整个 B+ 树的最大元素。

第三点,叶子节点包含了全部的数据,并且按顺序排列,B+ 树使用一个链表将它们排列起来,这样在查询时效率更快。

由于 B+ 树的中间节点不含有实际数据,只有子树的最大数据和子树指针,因此磁盘页中可以容纳更多节点元素,也就是说同样数据情况下,B+ 树会 B 树更加“矮胖”,因此查询效率更快。

B+ 树的查找必会查到叶子节点,更加稳定。

有时候需要查询某个范围内的数据,由于 B+ 树的叶子节点是一个有序链表,只需在叶子节点上遍历即可,不用像 B 树那样挨个中序遍历比较大小。

四、B+ 树的三个优点:



IO 次数少,磁盘读写代价低

B+树的内部节点并没有指向关键字具体信息的指针,因此其内部节点相对B树更小,如果把所有同一内部节点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多,一次性读入内存的需要查找的关键字也就越多,相对IO读写次数就降低了。

查询性能稳定

由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当。

B+树更适合基于范围的查询

B树在提高了IO性能的同时并没有解决元素遍历的我效率低下的问题,正是为了解决这个问题,B+树应用而生。B+树只需要去遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作或者说效率太低。



相关推荐 


2、



回复关键词

 Redis    分布式限流   MySQL     alibaba     JVM性能调优  

看更多精彩教程


喜欢本文,记得点击个在看,或者分享给朋友哦!