MySql学习之性能分析Explain使用

来源:互联网 发布:如何拍好淘宝产品照片 编辑:程序博客网 时间:2024/06/04 23:18

1、MySql Query Optimizer 查询优化器

MySql中有专门负责优化SELECT语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息,为客户端请求的Query提供他认为最优的执行计划(他认为最优的数据检索方式,但是不见得是DBA认为是最优的,这部分最消耗时间)。
当客户端向MySql请求一条Query,命令解析器模块完成请求分类,区别出是SELECT并转发给MySql Query Optimizer时,MySql Query Optimizer首先对整条Query进行优化,处理掉一些常量表达式的预算,直接换算成常量值。并对Query中的查询条件进行简化和转换,如去掉一些无用或显而易见的条件、结构调整等。然后分析Query中的Hint信息(如果有),看显示Hint信息是否可以完全确认该Query的执行计划。如果没有Hint或Hint信息还不足以完全确定执行计划,则会读取所涉及对象的统计信息,根据Query进行写相对应的计算分析,然后再得出最后的执行计划。

2、MySql常见瓶颈

(1)CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据的时候。
(2)IO:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候。
(3)服务器硬件的性能瓶颈:top、free、iostat和vmstat来查看系统的性能状态。

3、Explain简介

使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySql是如何处理你的SQL语句的。分析查询语句或是表结构的性能瓶颈。

4、Explain使用

Explain + sql

5、包含的信息

这里写图片描述

6、id(顺序号)、table(表名)

(1)select查询的序列号,包含一组数字,表示查询中执行select子句或表的顺序。

(2)三种情况

①id相同,执行顺序由上至下。

id相同,执行顺序由上至下

id相同,执行顺序t1、t2、t3。

②id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行。

这里写图片描述

id不同,id值越大越先被执行,执行顺序t3、t1、t2。

③id相同、不同,同时存在。

这里写图片描述

id相同、不同,执行顺序t3、derived2、t2。

7、select_type查询类型

(1)SIMPLE:简单的SELECT查询,查询中不包含子查询或者UNION。
(2)PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY。
(3)SUBQUERY:在SELECT或WHERE列表中包含了子查询。
(4)DERIVER:在FROM列表中包含的子查询被标记为DERIVER(衍生),MySql会递归执行这些子查询,把结果放在临时表里。
(5)UNION:若第二个SELECT出现在UNION之后,则被标记为UNION,若UNION包含在FROM子句的子查询中,外层SELECT将被标记为DERIVER。
(6)UNION RESULT:从UNION表获取结果的SELECT(两个UNION查询合并的结果)。

8、type

显示的是访问类型,是较为重要的一个指标。

(1)system:表只有一行记录(等于系统表),这个const类型的特列,平时不会出现,可以忽略不计。
(2)const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快将主键置于where列表中,MySql就能将该查询转换为一个常量。
(3)eq_ref:唯一性索引扫描,对于每个索引,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
(4)ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质也是一种索引访问,它返回所有匹配某个单独值的行。然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
(5)fulltext:全文索引检索,要注意,全文索引的优先级很高,若全文索引和普通索引同时存在时,mysql不管代价,优先选择使用全文索引。
(6)ref_or_null:与ref方法类似,只是增加了null值的比较。实际用的不多。
(7)index_merge:表示查询使用了两个以上的索引,最后取交集或者并集,常见and ,or的条件使用了不同的索引,官方排序这个在ref_or_null之后,但是实际上由于要读取所个索引,性能可能大部分时间都不如range
(8)unique_subquery:用于where中的in形式子查询,子查询返回不重复值唯一值
(9)index_subquery:用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值,可以使用索引将子查询去重。
(10)range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了那个索引。一般就是在你的where语句中出现了between、<、>、in等查询。这种范围扫描索引比全表扫描要好,因为只需要开始于索引的某一点,而结束于另一点,不用扫描全部索引。
(11)index:Full Index Scan,index与ALL区别为index类型只遍历索引数。这通常比ALL快,因为索引文件通常比数据文件小(也就是说虽然all和index都是读全表,但是index是从索引中读取,而all是从硬盘中读取)。
(12)all:Full Table Scan,将遍历全表以找到匹配的行。

结果值从最好到最坏依次是:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

简化后(常用)为:system > const > eq_ref > ref > range > index > ALL

一般来说,得保证查询至少达到range级别,最好能达到ref。

9、possible_key、key和key_len

possible_keys:查询可能使用到的索引都会在这里列出来,但不一定被查询实际使用。

key:查询真正使用到的索引,如果为空,则没有使用索引。查询中若出现覆盖索引,则该索引会出现在key列表中。select_type为index_merge时,这里可能出现两个以上的索引,其他的select_type这里只会出现一个。

key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引长度。在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索所得。

10、ref和rows

ref:如果是使用的常数等值查询,这里会显示const,如果是连接查询,被驱动表的执行计划这里会显示驱动表的关联字段,如果是条件使用了表达式或者函数,或者条件列发生了内部隐式转换,这里可能显示为func。

rows:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,不是精确值。数值越小越好。

11、Extra

包含不适合在其他列中显示但十分重要的额外信息。

(1)Using filesort:说明MySql会对数据使用一个外部的索引排序,而不是按照表内的索引排序进行读取。MySql中无法利用索引完成的排序操作称为“文件排序”。
(2)Using temporary:使用了临时表保存中间结果,MySql在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。
(3)USING index:表示相应的select操作中使用了覆盖索引,避免访问了表的数据行。如果同时出现Using where,表明索引被用来执行索引键值的查找;如果没有同时出现Using where,表明索引用来读取数据而非执行查找动作。
(4)Using where:表明使用了where过滤。
(5)Using join buffer:表明使用了连接缓存。
(6)impossible where:where子句的值总是false,不能用来获取任何元组。
(7)select tables optimized away:在没有GROUB BY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM储存引擎优化COUNT(*)操作,不必等到执行阶段在进行计算,查询执行计划生成的阶段即完成优化。
(8)distinct:优化distinct操作,在找到第一匹配元组后即停止查找同样值的动作。