MySQL索引

来源：互联网发布：php 转换编码为utf8 编辑：程序博客网时间：2024/06/06 20:37

1. 作用
1.1 作用
帮助 MySQL 高效获取的数据的数据结果。它对于高性能非常关键，但是人们通常会忘记或误解它，因此建立索引（indexing）是现实中性能问题的首要原因。
1.2 原理
索引页面相对于数据页面来说小得多。当进行数据检索时，系统先搜索索引页面，从中找到所需数据的指针，再直接通过指针从数据页面中读取数据。

从某种程度上，可以把数据库看作一本书，把索引看作书的目录，通过目录查找书中的信息，显然较没有目录的书方便、快捷。

2. 特点
2.1 索引可以加快数据库的检索速度
2.2 索引降低了数据库插入、修改、删除等维护任务的速度
2.3 索引创建在表上，不能创建在视图上
2.4 索引既可以直接创建，也可以间接创建
2.5 使用查询处理器执行SQL语句，在一个表上，一次只能使用一个索引

3. 使用注意

3.1 数字型比字符串型索引更高效，减少甚至避免给字符型建索引
3.2 字符串型的索引尽量使用前缀索引
create index IDX_FORUMDOC_HREF on FORUM_DOC (S_HREF(30));
3.3 避免使用NULL字段
MySQL难以优化引用了可空列的查询、它会使索引、索引统计和值更加复杂。可空列需要更多的存储空间，还需要在MySQL 内部进行特殊处理。当可空列被索引的时候，每条记录都需要一个额外的字节，还能导致MyISAM中固定大小的索引（例如一个整数列上的索引）变成可变大小的索引。
3.4 不在索引列做运算或使用函数
无法使用索引，导致全表扫描。
3.5 尽量不用外键，不用连表查询
在JOIN操作中(需要从多个数据表提取数据时)，MySQL只有在主键和外键的数据类型相同时才能使用索引。
3.6 主键会自动建立聚集索引
在 InnoDB 中按照主键顺序插入行。最简单的办法是使用AUTO_INCREMENT列。这会保证是顺序插入的并且提高使用主键联接的性能。最好避免随机（乱序）聚集键（主键）。使用UUID值是不好的选择；它使聚集索引插入是随机的，这是最坏的情形，并且会使数据集完全没有帮助。
3.7 避免负向查询和%前缀模糊查询。
避免负向查询，NOT、!=、<>、!<、!>、NOT EXISTS、NOT IN、NOT LIKE等。避免%前缀模糊查询，使用不了索引，导致全表扫描。
3.8 如果某个数据列包含许多重复的内容，为它建立索引就没有太大的实际效果。
3.9 谨防where子句中的OR。
3.10 建议使用in或者union代替
3.11 经常同时存取多列，且每列都含有重复值可考虑建立组合索引
复合索引的前导列一定好控制好，否则无法起到索引的效果。如果查询时前导列不在查询条件中则该复合索引不会被使用。前导列一定是使用最频繁的列。

4. 缺点

4.1 索引还会在硬盘上占用相当大的空间
4.2 MySQL把同一个数据表里的索引总数限制为16个
4.3 索引需要占物理空间，除了数据表占数据空间之外，每一个索引还要占一定的物理空间，如果要建立聚簇索引，那么需要的空间就会更大
4.4 创建索引和维护索引要耗费时间，这种时间随着数据量的增加而增加
4.5 每修改数据记录，索引就必须刷新一次。为了在某种程序上弥补这一缺陷，许多SQL命令都有一个DELAY_KEY_WRITE项
4.6 当对表中的数据进行增加、删除和修改的时候，索引也要动态的维护，降低了数据的维护速度

5. 工具

5.1 explain
explain是用来分析sql语句，帮助优化的一个命令。执行结果会有id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra几列
5.1.1 列名说明
type表示链接的类型。比较重要。链接类型由好到坏的，依次是system>const>eq_ref>ref>fulltext>ref_or_null>index_merge>unique_subquery>index_subquery>range>index>ALL。一般情况，至少要达到range级别，最好是ref级别。否则可能会有性能问题。
extra是指额外的信息。比较重要。distinct，说明mysql找到了域行联合匹配的行，就不再查找了。not_exits:mysql优化了left_join，一旦找到了left_join匹配的行，便不再进行搜索了。 rang checked for each没有找到理想的索引。using filesort ，则需要改进sql了。这说明 mysql执行需要文件排序。这是比较影响效率的。using temporary , 这是使用了临时表。这种情况也比较影响效率，sql需要改进。或者从应用层进行改进。where used 说明使用了where语句。如果 type为 all 或者 index ，一般会出现这样的结果。这样的问题，一般是查询需要改进。
possible_keys 是指可以应用到该表的索引，如果为NULL则没有。
key 是指用到的索引。
key_len 是索引的长度，在不影响查询精度的情况下，值越小越好。
ref 是指索引的那一列被使用了。一般会是个常数。
rows 是指有多少行。
table 表示是哪个表的数据。
5.2 慢日志
慢查询日志是记录了所有执行超过long_query_time（单位：秒）所设置值的sql语句的文本文件，辅助查询出运行慢的sql，定位问题
参数
log_slow_queries表示慢查询功能是否开启
slow_query_log_file表示慢查询日志的位置
long_query_time表示慢sql的设定值，超过该值就写入慢查询日志
查看
文本文件，可以直接查看
mysqldumpslow工具，可以进行分类查看

6. 配置参数

key_buffer_size，设置索引缓存的大小，只适用于MyISAM引擎
innodb_buffer_pool_size，为InnoDB数据表及其索引而保留的RAM内存量
innodb_additional_men_pool_size， InnoDB用来存储数据字典(data dictionary)信息和其它内部数据结构(internaldata structures)的存储器组合(memorypool)大小。
join_buffer_size，在参加JOIN操作的数据列没有索引时为JOIN操作分配的缓存区长度，不宜>2M