第一弹:MySQL架构与存储引擎
MySQL架构与存储引擎
1、MySQL架构
连接层:完成客户端和连接服务,主要功能为连接处理、授权认证、安全方案认证
服务层:权限判断, sql解析,执行计划优化;存储过程,触发器,视图
引擎层:底层数据存取操作实现部分
存储层:设备的文件系统
2、一条SQL执行流程
客户端请求 ---> 连接器(验证用户身份,给予权限) ---> 查询缓存(存在缓存则直接返回,不存在则执行后续操作) ---> 分析器(对SQL进行词法分析和语法分析操作) ---> 优化器(主要对执行的sql优化选择最优的执行方案方法) ---> 执行器(执行时会先看用户是否有执行权限,有才去使用这个引擎提供的接口) ---> 去引擎层获取数据返回
3、更新数据执行流程
取数据行
: 执行器先找引擎取 ID=2 这一行:ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2 这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。)更新数据
: 执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的一行数据,再调用引擎接口写入这行新数据。更新内存
: 引擎将这行新数据更新到内存中,更新 redo log
:同时将这个更新操作记录到 redo log 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。写入binlog
:执行器生成这个操作的 binlog,并把 binlog 写入磁盘。提交事务
: 执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成
4、redo log简介:
redo log 是InnoDB引擎特有的物理日志,记录的是数据页的物理修改,即用于记录事务操作的变化,不管事务是否提交都会记录下来。有了 redo log,InnoDB 就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,InnoDB存储引擎会使用redo log恢复到掉宕机前的时刻,以此来保证数据的完整性。这个能力称为crash-safe。
InnoDB的redo log 是固定大小,即记录满了以后就从头循环写。
流程
提交事务 -> 日志写入relog log buffer -> os buffer -> 写入磁盘的log file -> 根据checkpoint更新磁盘中的数据
5、bin log简介:
binlog是属于MySQL Server层面的,又称为归档日志,属于逻辑日志,
binlog主要作用:复制(Master-Slave 主从同步)、恢复和审计。
6、存储引擎有哪些?
常见的存储引擎就 InnoDB、MyISAM、Memory、NDB。
InnoDB 支持事务,MyISAM 不支持事务。这是 MySQL 将默认存储引擎从 MyISAM 变成 InnoDB 的重要原因之一;
InnoDB 支持外键,而 MyISAM 不支持。对一个包含外键的 InnoDB 表转为 MYISAM 会失败;
InnoDB 是聚簇索引,MyISAM 是非聚簇索引。聚簇索引的文件存放在主键索引的叶子节点上,因此 InnoDB 必须要有主键,通过主键索引效率很高。但是辅助索引需要两次查询,先查询到主键,然后再通过主键查询到数据。因此,主键不应该过大,因为主键太大,其他索引也都会很大。而 MyISAM 是非聚集索引,数据文件是分离的,索引保存的是数据文件的指针。主键索引和辅助索引是独立的。
InnoDB 不保存表的具体行数,执行select count(*) from table 时需要全表扫描。而 MyISAM 用一个变量保存了整个表的行数,执行上述语句时只需要读出该变量即可,速度很快;
InnoDB 最小的锁粒度是行锁,MyISAM 最小的锁粒度是表锁。一个更新语句会锁住整张表,导致其他查询和更新都会被阻塞,因此并发访问受限。这也是 MySQL 将默认存储引擎从 MyISAM 变成 InnoDB 的重要原因之一;