vlambda博客
学习文章列表

【绝杀面试官七问】MySQL【基础】篇(一)

 每天十分钟,轻松拿offer。

MySql

官网:https://www.mysql.com/




01


问:为什么要使用数据库?


答:

  • 如果数据保存在内存中

    存取速度快但是数据不能永久保存

  • 如果数据保存在文件中

    数据永久保存但是速度比内存操作慢,频繁的IO操作。查询数据也不方便

  • 如果数据保存在数据库中

    数据永久保存,使用SQL语句,查询方便效率高。管理数据也方便





02



什么是SQL?


答:

  • sql全称是结构化查询语言,即Structured Query Language,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统,同时也是数据库脚本文件的扩展名。

  • SQL是结构化查询语言的简称,它是一种数据库查询和程序设计语言,同时也是目前使用最广泛的关系型数据库操作语言。在数据库管理系统中,使用SQL语言来实现数据的存取、查询、更新等功能。SQL是一种非过程化语言,只需要提出“做什么”,而不需要指明“怎么做”。




03



什么是MySQL?


答:

  • MySQL就是结构化数据的集合,同时也是数据库的管理系统,目前MySQL算是比较流行的数据库之一,在web方面,MySQL也是最好的应用软件,和其他的主流操作系统相互兼容。

  • MySQL是一种关系型数据库,并且保存在数据库不同的表中,把这些数据放到一个大数据中,MySQL是使用sql语言进行访问的,总的来说,MySQL访问速度比较快,成本低,很多网站都使用MySQL作为网站的数据库。但是唯一不足的就是开放源码软件,因此要降低成本。

  • mysql有什么用?

  • mysql能储存数据,查找起来也是很方便的,并且可以保证数据的安全性和完整性,通过组合分析,产生有价值的信息。

  • MySQL的支持接口?

  • MySQL的支持接口有PHP 、Python、API、JDBC、Perl、CDBC、Ruby、NET。并且和连接池连接对象,使用的时候直接获取





04



问:数据库三大范式是什么?


答:

  • 第一范式:在关系模型中,数据库表中的每一列都是不可分割的原子项数据

    ps:原子性,即不可分割一列数据只保存一种信息

  • 第二范式:在第一范式的基础上,数据库表的每一列都必须完全依赖于主键

    ps:若为联合主键,数据表每一列必须与联合主键相关,而不是依赖于其中一部分

  • 第三范式:在第二范式的基础上,数据库表的每一列都要直接依赖于主键,不可进行依赖传递

    ps:员工表若已存在part_id,则不允许有part_name通过part_id传递依赖于员工表主键

  • 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式。





05



问:mysql有关权限的表都有哪几个?


答:

  • 权限表分别user,db,table_priv,columns_priv和host

    MySQL服务器通过权限表来控制用户对数据库的访问,权限表存放在mysql数据库里,由mysql_install_db脚本初始化。下面分别介绍一下这些表的结构和内容:

  • user权限表:记录允许连接到服务器的用户帐号信息,里面的权限是全局级的。

  • db权限表:记录各个帐号在各个数据库上的操作权限。

  • table_priv权限表:记录数据表级的操作权限。

  • columns_priv权限表:记录数据列级的操作权限。

  • host权限表:配合db权限表对给定主机上数据库级操作权限作更细致的控制。这个权限表不受GRANT和REVOKE语句的影响。





06



问:MySQL的binlog有几种录入格式?分别有什么区别?


答:

有三种格式,statement,row和mixed。

statement模式下,每一条会修改数据的sql都会记录在binlog中。不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。由于sql的执行是有上下文的,因此在保存的时候需要保存相关的信息,同时还有一些使用了函数之类的语句无法被记录复制。

row级别下,不记录sql语句上下文相关信息,仅保存哪条记录被修改。记录单元为每一行的改动,基本是可以全部记下来但是由于很多操作,会导致大量行的改动(比如alter table),因此这种模式的文件保存的信息太多,日志量太大。

mixed,一种折中的方案,普通操作使用statement记录,当无法使用statement的时候使用row。

此外,新版的MySQL中对row级别也做了一些优化,当表结构发生变化的时候,会记录语句而不是逐行记录。





07



问:mysql有哪些数据类型?


答:


分类 类型名称 说明
整数类型 tinyInt 很小的整数(8位二进制)

smallint 小的整数(16位二进制)

mediumint 中等大小的整数(24位二进制)

int(integer) 普通大小的整数(32位二进制)
小数类型 float 单精度浮点数

double 双精度浮点数

decimal(m,d) 压缩严格的定点数
日期类型 year YYYY 1901~2155

time HH:MM:SS -838:59:59~838:59:59

date YYYY-MM-DD 1000-01-01~9999-12-3

datetime YYYY-MM-DD HH:MM:SS 1000-01-01 00:00:00~ 9999-12-31 23:59:59

timestamp YYYY-MM-DD HH:MM:SS 19700101 00:00:01 UTC~2038-01-19 03:14:07UTC
文本、二进制类型 CHAR(M) M为0~255之间的整数

VARCHAR(M) M为0~65535之间的整数

TINYBLOB 允许长度0~255字节

BLOB 允许长度0~65535字节

MEDIUMBLOB 允许长度0~167772150字节

LONGBLOB 允许长度0~4294967295字节

TINYTEXT 允许长度0~255字节

TEXT 允许长度0~65535字节

MEDIUMTEXT 允许长度0~167772150字节

LONGTEXT 允许长度0~4294967295字节

VARBINARY(M) 允许长度0~M个字节的变长字节字符串

BINARY(M) 允许长度0~M个字节的定长字节字符串
  • 整数类型,包括TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT,分别表示1字节、2字节、3字节、4字节、8字节整数。任何整数类型都可以加上UNSIGNED属性,表示数据是无符号的,即非负整数。长度:整数类型可以被指定长度。

  • 例如:INT(11)表示长度为11的INT类型。长度在大多数场景是没有意义的,它不会限制值的合法范围,只会影响显示字符的个数,而且需要和UNSIGNED ZEROFILL属性配合使用才有意义。

  • 例子,假定类型设定为INT(5),属性为UNSIGNED ZEROFILL,如果用户  插入的数据为12的话,那么数据库实际存储数据为00012。

  • 实数类型,包括FLOAT、DOUBLE、DECIMAL。DECIMAL可以用于存储比BIGINT还大的整型,能存储精确的小数。而FLOAT和DOUBLE是有取值范围的,并支持使用标准的浮点进行近似计算。计算时FLOAT和DOUBLE相比DECIMAL效率更高一些,DECIMAL你可以理解成是用字符串进行处理。

  • 字符串类型,包括VARCHAR、CHAR、TEXT、BLOBVARCHAR用于存储可变长字符串,它比定长类型更节省空间。VARCHAR使用额外1或2个字节存储字符串长度。列长度小于255字节时,使用1字节表示,否则使用2字节表示。VARCHAR存储的内容超出设置的长度时,内容会被截断。CHAR是定长的,根据定义的字符串长度分配足够的空间。CHAR会根据需要使用空格进行填充方便比较。CHAR适合存储很短的字符串,或者所有值都接近同一个长度。CHAR存储的内容超出设置的长度时,内容同样会被截断。

  • 使用策略:对于经常变更的数据来说,CHAR比VARCHAR更好,因为CHAR不容易产生碎片。对于非常短的列,CHAR比VARCHAR在存储空间上更有效率。使用时要注意只分配需要的空间,更长的列排序时会消耗更多内存。尽量避免使用TEXT/BLOB类型,查询时会使用临时表,导致严重的性能开销。

  • 枚举类型(ENUM),把不重复的数据存储为一个预定义的集合。有时可以使用ENUM代替常用的字符串类型。ENUM存储非常紧凑,会把列表值压缩到一个或两个字节。ENUM在内部存储时,其实存的是整数。尽量避免使用数字作为ENUM枚举的常量,因为容易混乱。排序是按照内部存储的整数

  • 日期和时间类型,尽量使用timestamp,空间效率高于datetime,用整数保存时间戳通常不方便处理。如果需要存储微妙,可以使用bigint存储。