MySQL GROUP BY 操作的优化

来源：互联网发布：域名注册多少钱编辑：程序博客网时间：2024/05/21 21:47

MySQL GROUP BY 操作的优化
默认情况下， MySQL 在执行 GROUP BY col1 ， col2.... 操作的时候，会按照 GROUP BY 字段的顺序进行排序。如果显式包括一个包含相同的列的 ORDER BY 子句，则对 MySQL 的实际执行性能没有什么额外的影响。

如果查询包括 GROUP BY 操作，但是不需要对结果进行排序，或者对默认的排序结果不满意，希望获得结果后再由程序进一步处理的时候，可以指定 ORDER BY NULL 禁止排序，从而避免排序结果的消耗。

下面介绍的例子对比了开启 / 关闭 GROUP BY 排序的执行计划：

mysql> desc select dep,pos,avg(sal) from employee group by dep,pos G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: employee

type: ALL

possible_keys: NULL

key: NULL

key_len: NULL

ref: NULL

rows: 10

Extra: Using temporary; Using filesort

1 row in set (0.00 sec)

mysql> desc select dep,pos,avg(sal) from employee group by dep,pos order by null G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: employee

type: ALL

possible_keys: NULL

key: NULL

key_len: NULL

ref: NULL

rows: 10

Extra: Using temporary

1 row in set (0.00 sec)

从执行计划可以看到，使用了 ORDER BY NULL 的 SQL 减少了文件排序的步骤，当返回结果集很大时，对于 GROUP BY 的性能是有很大改善的。

在大多数情况下，DISTINCT子句可以视为GROUP BY的特殊情况。例如，下面的两个查询是等效的：

SELECT DISTINCT c1, c2, c3 FROM t1 WHERE c1 > const;

SELECT c1, c2, c3 FROM t1 WHERE c1 > const GROUP BY c1, c2, c3;

由于这个等效性，适用于GROUP BY查询的优化也适用于有DISTINCT子句的查询

结合LIMIT row_count和DISTINCT后，MySQL发现唯一的row_count行后立即停止。

如果不使用查询中命名的所有表的列，MySQL发现第1个匹配后立即停止扫描未使用的表。在下面的情况中，假定t1在t2之前使用(可以用EXPLAIN检查)，发现t2中的第1行后，MySQL不再(为t1中的任何行)读t2：

SELECT DISTINCT t1.a FROM t1, t2 where t1.a=t2.a;