高性能MySQL第六章笔记

来源：互联网发布：网络直播发展史编辑：程序博客网时间：2024/05/21 18:34

1.不要查询不需要的列，不要用select *（减少内存占用和网络带宽占用，减少表结构变化带来的影响）
2.EXPLAIN语句结果中的rows是预估的要扫描的行数，Extra：Using Where表示MySQL将通过WHERE条件来筛选存储引擎（注意是存储引擎）返回的记录
   一般MySQL能够使用如下三种方式应用WHERE条件，从好到坏：
   在索引中使用WHERE条件来过滤，在存储引擎层
   使用索引覆盖扫描（在Extra列中出现了Using index）来返回记录，直接从索引中过滤不需要的记录并返回命中的结果。这是在MySQL服务器层返回的，但无须再回表查询记录。
   从数据表中返回数据，然后过滤不满足条件的记录（Extra：Using Where）。这是在MySQL服务层完成，MySQL需要从数据表读出记录然后过滤。

3.使用多个简单查询来代替一个复杂查询
   3.1如每个月删除旧的数据，为了防止一次锁住很多数据，占满整个事务日志，耗尽系统资源，阻塞很多小的但重要的查询：
   将DELETE FROM message WHERE created < DATE_SUB(NOW,INTERVAL 3 MONTH);
   换为：
   rows_affected = 0
   do{
       rows_affected = do_query(
       "DELETE FROM message WHERE created < DATE_SUB(NOW,INTERVAL 3 MONTH)
       LIMIT 10000"
       )
   }while rows_affected>0

   3.2分解关联查询
   优势：
   让缓存的效率更高;减少锁的竞争;在应用层做关联，可以更容易对数据库进行拆分，更容易做到高性能和可扩展;减少冗余记录的查询，减少内存和网络的消耗。

4.查询执行的基础
   内容比较多，这里只记录几点：

4.1 查询执行路径

   4.2 查询状态：可用SHOW FULL PROCESSLIST命令查看查询状态
   4.3 MySQL如何执行关联查询：嵌套循环
   4.4 MySQL的临时表是没有索引的，在编写复杂的子查询和关联查询的时候需要注意这一点

5.MySQL查询优化器的缺陷
   5.1 避免用IN(子查询)
   如SELECT * FROM sakila.film WHERE file_id IN(
       SELECT film_id FROM sakila.film_actor WHERE actor_id = 1;
       )
   我们会认为上面的查询会这样执行：
   --SELECT GROUP_CONCAT(film_id) FROM sakila.film_actor WHERE actor_id = 1;
   --Result:1,23,25,106,140,166,277,361,436,499,506,509,605,635,749,832,939,970,980
   SELECT * FROM sakila.film
   WHERE film_id
   IN(1,23,25,106,140,166,277,361,436,499,506,509,605,635,749,832,939,970,980)

   但MySQL实际会将查询改写成下面这样的关联子查询：
   SELECT * FROM sakila.film
   WHERE EXISTS(
       SELECT * FROM sakila.film_actor WHERE actor_id = 1
       AND film_actor.film_id = film.film_id);
   性能非常差

   可用如下语句改写：
   SELECT film.* FROM sakila.film
   INNER JOIN sakila.film_actor USING(film_id)
   WHERE actor_id = 1;‘
   另一个优化的方法是使用GROUP_CONCAT()在IN()中构造一个由逗号分隔的列表
   注1：关联子查询：在关联子查询中，对于外部查询返回的每一行数据，内部查询都要执行一次。另外，在关联子查询中是信息流是双向的。外部查询的每行数据传递一个值给子查询，然后子查询为每一行数据执行一次并返回它的记录。然后，外部查询根据返回的记录做出决策。
   注2：可用EXPLAIN EXTENDED来查看这个查询被改写成什么样子
   注3：前面提到关联子查询效率低，可以用join代替，但其实不是所有关联子查询效率都低，应当测试
    注4：可用SHOW STATUS 查看扫描的行数
   5.2 如果要取出UNION ALL的两个子句的前N条可以在子句里面和外面都加上LIMIT N;
   5.3 MIN()和MAX()：
   看这个语句：SELECT MIN(actor_id) FROM sakila.actor WHERE first_name = 'PENELOPE';
   first_name上没有索引所以会全表扫描，因为主键是按照从小到大排列，理论上扫描到第一个满足条件的记录就是了，可是MySQL却只会全表扫表，重写：
   SELECT actor_id FROM sakila.actor USE INDEX(PRIMARY)
   WHERE first_name = 'PENELOPE' LIMIT 1;
6. 优化特定类型的查询
   6.1 COUNT()或COUNT(*)统计行数，COUNT(exp)统计exp有值的结果数
   条件反转优化：
   将SELECT COUNT(*) FROM world.City WHERE ID > 5;
   优化为：
   SELECT （SELECT COUNT（*） FROM world.City）-COUNT(*)
   WHERE world.City WHERE ID < 5;
   近似值优化，有些业务不需要精确值，可以用EXPLAIN出来的rows近似值代替：

   6.2 优化关联查询：
   确保ON或者USING子句中的列上有索引
   确保GROUP BY和ORDER BY中的表达式只涉及一个表中的列，这样MySQL才能使用索引来优化这个过程

   6.3 优化子查询
   尽可能使用关联查询代替（MySQL5.6后可忽略这条）

   6.4优化LIMIT分页
   大偏移量时LIMIT效率很差，因为他会扫描很多然后丢弃他们
   SELECR film_id,description FROM sakila.film ORDER BY title LIMIT 50,5
   "延迟关联"优化为：
   SELECT film.film_id , film.description
   FROM sakila.film
   INNER JOIN(
       SELECT film_id FROM sakila.film
       ORDER BY title LIMIT 50,5
   )AS lim USING(film_id)

   另一种优化是，预先存储排名信息，然后优化为：
   SELECT film_id，description FROM sakila.film
   WHERE position BETWEEN 50 AND 54 ORDER BY position

   6.5 优化UNION查询
   MySQL总是通过创建并填充临时表的方式来执行UNION查询，因此很多优化策略在UNION中都没法很好地使用，经常需要手动的将WHERE，LIMIT，ORDER BY等子句“下推”到UNION的各个子查询中，以便优化器利用这些条件进行优化。
   除非确实需要消除重复的行，否则就一定要使用UNION ALL，如果没有ALL，MySQL就会给临时表加上DISTINCT选项，代价很高
7.其他注意点:
   7.1不要用前置%和前后双%，这会使索引失效
   7.2 索引的最左前缀匹配
   7.3 使用left join或not exists来优化not in（会使索引失效）
   7.4 避免隐式转换，这会使索引失效
   7.5 使用in代替or，in可利用索引
   7.6 不要join太多表
   7.7 程序中使用预编译语句：防止SQL注入;同步地使用执行计划;一次解析，多次利用
   7.8 程序连接不同数据库使用不同的帐号，禁止跨库查询：降低业务耦合度;安全;为了以后的分库分表和数据库迁移
   7.9 禁止使用不含字段列表的INSERT语句
   7.10 减少同数据库的交互次数
   7.11 禁止用ORDER BY rand()进行随机排序：这会把表中所有符合条件的数据装载到内存中;推荐在程序中获取随机值到数据库中取相应的数据
   7.12 禁止在WHERE中对列进行函数转换和计算，这回导致索引失效

0 0