vlambda博客
学习文章列表

第一弹:MySQL架构与存储引擎

MySQL架构与存储引擎

1、MySQL架构

  • 连接层:完成客户端和连接服务,主要功能为连接处理、授权认证、安全方案认证

  • 服务层:权限判断, sql解析,执行计划优化;存储过程,触发器,视图

  • 引擎层:底层数据存取操作实现部分

  • 存储层:设备的文件系统 

2、一条SQL执行流程

客户端请求 ---> 连接器(验证用户身份,给予权限) ---> 查询缓存(存在缓存则直接返回,不存在则执行后续操作) ---> 分析器(对SQL进行词法分析和语法分析操作) ---> 优化器(主要对执行的sql优化选择最优的执行方案方法) ---> 执行器(执行时会先看用户是否有执行权限,有才去使用这个引擎提供的接口) ---> 去引擎层获取数据返回

3、更新数据执行流程

  • 取数据行: 执行器先找引擎取 ID=2 这一行:ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2 这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。)

  • 更新数据: 执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的一行数据,再调用引擎接口写入这行新数据。

  • 更新内存: 引擎将这行新数据更新到内存中,

  • 更新 redo log :同时将这个更新操作记录到 redo log 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。

  • 写入binlog:执行器生成这个操作的 binlog,并把 binlog 写入磁盘。

  • 提交事务: 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成 

4、redo log简介:

  • redo log 是InnoDB引擎特有的物理日志,记录的是数据页的物理修改,即用于记录事务操作的变化,不管事务是否提交都会记录下来。有了 redo log,InnoDB 就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,InnoDB存储引擎会使用redo log恢复到掉宕机前的时刻,以此来保证数据的完整性。这个能力称为crash-safe。

  • InnoDB的redo log 是固定大小,即记录满了以后就从头循环写。
    流程

  • 提交事务 -> 日志写入relog log buffer -> os buffer -> 写入磁盘的log file -> 根据checkpoint更新磁盘中的数据

5、bin log简介:

  • binlog是属于MySQL Server层面的,又称为归档日志,属于逻辑日志,

  • binlog主要作用:复制(Master-Slave 主从同步)、恢复和审计。

6、存储引擎有哪些?

  • 常见的存储引擎就 InnoDB、MyISAM、Memory、NDB。

  • InnoDB 支持事务,MyISAM 不支持事务。这是 MySQL 将默认存储引擎从 MyISAM 变成 InnoDB 的重要原因之一;

  • InnoDB 支持外键,而 MyISAM 不支持。对一个包含外键的 InnoDB 表转为 MYISAM 会失败;

  • InnoDB 是聚簇索引,MyISAM 是非聚簇索引。聚簇索引的文件存放在主键索引的叶子节点上,因此 InnoDB 必须要有主键,通过主键索引效率很高。但是辅助索引需要两次查询,先查询到主键,然后再通过主键查询到数据。因此,主键不应该过大,因为主键太大,其他索引也都会很大。而 MyISAM 是非聚集索引,数据文件是分离的,索引保存的是数据文件的指针。主键索引和辅助索引是独立的。

  • InnoDB 不保存表的具体行数,执行select count(*) from table 时需要全表扫描。而 MyISAM 用一个变量保存了整个表的行数,执行上述语句时只需要读出该变量即可,速度很快;

  • InnoDB 最小的锁粒度是行锁,MyISAM 最小的锁粒度是表锁。一个更新语句会锁住整张表,导致其他查询和更新都会被阻塞,因此并发访问受限。这也是 MySQL 将默认存储引擎从 MyISAM 变成 InnoDB 的重要原因之一;