1. 为什么要用MySQL Explain我们常常用到explain这个命令来查看一个这些SQL语句的执行计划,查看该SQL语句有没有使用上了索引,有没有做全表扫描,这都可以通过explain命令来查
1. 为什么要用MySQL Explain
我们常常用到explain这个命令来查看一个这些SQL语句的执行计划,查看该SQL语句有没有使用上了索引,有没有做全表扫描,这都可以通过explain命令来查看。所以我们深入了解MySQL的基于开销的优化器,还可以获得很多可能被优化器考虑到的访问策略的细节,以及当运行SQL语句时哪种策略预计会被优化器采用。
2. explain字段
概要描述:
- id: select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
- id相同,执行顺序由上至下(表的关联查询)
- id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行(含有子查询)
- id相同不同,同时存在(含有关联查询和子查询)
- select_type:表示查询中每个select子句的类型
- SIMPLE:简单SELECT,不使用UNION或子查询等
- PRIMARY:子查询中最外层查询,查询中若包含任何复杂的子部分,最外层的select被标记为PRIMARY
- UNION:UNION中的第二个或后面的SELECT语句
- DEPENDENT UNION:UNION中的第二个或后面的SELECT语句,取决于外面的查询
- UNION RESULT:UNION的结果,union语句中第二个select开始后面所有select
- SUBQUERY:子查询中的第一个SELECT,结果不依赖于外部查询
- DEPENDENT SUBQUERY:子查询中的第一个SELECT,依赖于外部查询
- DERIVED:派生表的SELECT, FROM子句的子查询
- UNCACHEABLE SUBQUERY:一个子查询的结果不能被缓存,必须重新评估外链接的第一行
- table:输出结果集的表
- partitions:匹配的分区
- type:对表访问方式,表示MySQL在表中找到所需行的方式,又称“访问类型”。从上到下,性能从差到好(一般来说,得保证查询至少达到range级别,最好能达到ref)
- ALL:Full Table Scan, MySQL将遍历全表以找到匹配的行
- index: Full Index Scan,Index与All区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和Index都是读全表,但index是从索引中读取的,而all是从硬盘读取的)
- range:只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引,一般就是在你的where语句中出现between、< 、>、in等的查询(between的是有索引的字段),这种范围扫描索引比全表扫描要好,因为它只需要开始于索引的某一点,而结束于另一点,不用扫描全部索引。
- ref: 非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
- eq_ref: 唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
- const:表示通过索引一次就找到了,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快。如将主键置于where列表中,MySQL就能将该查询转换为一个常量。
- system: 表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计
- NULL: MySQL在优化过程中分解语句,执行时甚至不用访问表或索引,例如从一个索引列里选取最小值可以通过单独索引查找完成。
- possible_keys:显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
- 实际使用的索引,如果为NULL,则没有使用索引。(可能原因包括没有建立索引或索引失效)
- 查询中若使用了覆盖索引(select 后要查询的字段刚好和创建的索引字段完全相同),则该索引仅出现在key列表中
- key:表示实际使用的索引
- key_len:索引字段的长度
- 表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度(key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的);不损失精确性的情况下,长度越短越好
- ref:显示索引的那一列被使用了,如果可能的话,最好是一个常数。哪些列或常量被用于查找索引列上的值。
- rows:扫描出的行数(估算的行数)
- filtered:按表条件过滤的行百分比
- Extra:执行情况的描述和说明
- Using index:表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错。如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表明索引用来读取数据而非执行查找动作
- Using where:不用读取表中所有信息,仅通过索引就可以获取所需数据,这发生在对表的全部的请求列都是同一个索引的部分的时候,表示mysql服务器将在存储引擎检索行后再进行过滤
- Using temporary:表示MySQL需要使用临时表来存储结果集,常见于排序和分组查询,常见 group by ; order by
- Using filesort:当Query中包含 order by 操作,而且无法利用索引完成的排序操作称为“文件排序”
- Using join buffer:改值强调了在获取连接条件时没有使用索引,并且需要连接缓冲区来存储中间结果。如果出现了这个值,那应该注意,根据查询的具体情况可能需要添加索引来改进能。
- Impossible where:这个值强调了where语句会导致没有符合条件的行(通过收集统计信息不可能存在结果)。
- Select tables optimized away:这个值意味着仅通过使用索引,优化器可能仅从聚合函数结果中返回一行
- No tables used:Query语句中使用from dual 或不含任何from子句
3. Mysql索引会失效的几种情况分析
- 如果条件中有or,即使其中有条件带索引也不会使用(这也是为什么尽量少用or的原因)(注意:要想使用or,又想让索引生效,只能将or条件中的每个列都加上索引)
- 对于多列索引,不是使用的第一部分,则不会使用索引
- like查询是以%开头
- 如果列类型是字符串,那一定要在条件中将数据使用引号引用起来,否则不使用索引
- 如果mysql估计使用全表扫描要比使用索引快,则不使用索引
- where语句中使用 <、>、 <>、Not In、is not null, BETWEEN对于数字是可以使用索引,而对于字符串是不可以使用索引
- where语句中对字段表达式操作(where age*2=100)
- 类型的隐式转换(字符转数字会失效,数字转字符不会失效)
4. 联合索引生效,现有一个联合索引 index table (k1, k2, k3)
where条件 | 能否用到索引 |
---|---|
k1=? | 能 |
k1=? and k2=? | 能 |
k1=? and k2=? and k3=? | 能 |
k1=? and k2=? and k3=? and k4=? | 能 |
k1=? and k2=? and k4=? and k3=? | 能 |
k2=? and k1=? | 能 |
k3=? and k1=? | 能 |
k1=? and k3=? | 能 |
k1=? and k4=? | 能 |
k3=? and k2=? and k1=? | 能 |
k3=? and k1=? and k2=? | 能 |
k2=? and k3=? and k1=? | 能 |
k3=? and k2=? | 否 |
k2=? and k3=? | 否 |
k2=? | 否 |
k3=? | 否 |
lower(k1)=? | 否 |
总结:联合索引最左匹配原则,即只要最最左侧的字段(即k1)存在where中,就会使用联合索引,与索引包含的字段的顺序无关。另外,如果字段有函数,也不会使用索引,其实这个很好理解,语句中对字段进行了表达式操作(以上用mysql8.0亲测)注意:group by利用索引与where条件语句中类似,但是对于order by,只有当字段出现在where条件中时,才会利用该字段的索引而避免排序,更准确的说,order by 中的字段在执行计划中利用了索引时,不用排序操作。