mysql索引详解

来源:互联网 发布:video.js点击全屏播放 编辑:程序博客网 时间:2024/06/08 13:50

定义:索引是指把你设置为索引的字段A的内容储存在一个独立区间S里,里面只有这个字段的内容。
在找查这个与这个字段A的内容时会直接从这个独立区间里查找,而不是去到数据表里查找。
找到的这些符合条件的字段后再读取字段A所指向真实的数据记录的物理地址,再把对应的数据内容输出。
 如果你查找的不是索引的字段那么他会从数据表里面查找。

1.索引的分类

Mysql常见索引有:普通索引、主键索引、唯一索引、全文索引、组合索引

1.PRIMARYKEY(主键索引)

    ALTER TABLE `table_name` ADD PRIMARY KEY ( column )

2.UNIQUE(唯一索引)

    ALTER TABLE `table_name` ADD UNIQUE index_name (column)

3.INDEX(普通索引)

    ALTER TABLE `table_name` ADD INDEX index_name ( column`)

4.FULLTEXT(全文索引)

    ALTER TABLE `table_name` ADD FULLTEXT ( column)

5.组合索引

    ALTER TABLE `table_name` ADD INDEX index_name ( column1, column2)

2.索引的区别

普通索引(INDEX):最基本的索引,没有任何限制

唯一索引(UNIQUE):与"普通索引"类似,不同的就是:索引列的值必须唯一,但允许有空值。

主键索引(PRIMARY):它 是一种特殊的唯一索引,不允许有空值。

全文索引(FULLTEXT ):仅可用于 MyISAM 表, 用于在一篇文章中,检索文本信息的, 针对较大的数据,生成全文索引很耗时好空间。

组合索引:为了更多的提高mysql效率可建立组合索引,遵循”最左前缀“原则。

举个例子说明:比如你在为某商场做一个会员卡的系统。

这个系统有一个会员表

有下列字段:

会员编号 INT

会员姓名 VARCHAR(10)

会员身份证号码 VARCHAR(18)

会员电话 VARCHAR(10)

会员住址 VARCHAR(50)

会员备注信息 TEXT

那么这个 会员编号,作为主键,使用 PRIMARY

会员姓名 如果要建索引的话,那么就是普通的 INDEX

会员身份证号码如果要建索引的话,那么可以选择 UNIQUE (唯一的,不允许重复)

会员备注信息, 如果需要建索引的话,可以选择 FULLTEXT,全文搜索。

不过 FULLTEXT 用于搜索很长一篇文章的时候,效果最好。

用在比较短的文本,如果就一两行字的,普通的 INDEX 也可以。

创建索引:CREATE UNIQUE INDEX indexName ON tableName(tableColumns(length))

删除索引的语法:DROP INDEX index_name ON tableName

3单列索引和组合索引

单列索引:即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引。

组合索引:即一个索包含多个列。

 

为了形象地对比两者,再建一个表:

CREATE TABLE myIndex (

i_testID INT NOT NULL AUTO_INCREMENT,

vc_Name VARCHAR(50) NOT NULL,

vc_City VARCHAR(50) NOT NULL,

i_Age INT NOT NULL,

i_SchoolID INT NOT NULL,PRIMARY KEY (i_testID)

);

 

在这10000条记录里面七上八下地分布了5条vc_Name="erquan"的记录,只不过city,age,school的组合各不相同。

来看这条T-SQL:

 

复制代码 代码如下:

SELECT i_testID FROM myIndexWHERE vc_Name='erquan' AND vc_City='郑州' AND i_Age=25;

 

首先考虑建单列索引:

    在vc_Name列上建立了索引。执行T-SQL时,MYSQL很快将目标锁定在了vc_Name=erquan的5条记录上,取出来放到一中间结果集。在这个结果集里,先排除掉vc_City不等于"郑州"的记录,再排除i_Age不等于25的记录,最后筛选出唯一的符合条件的记录。

虽然在vc_Name上建立了索引,查询时MYSQL不用扫描整张表,效率有所提高,但离我们的要求还有一定的距离。同样的,在vc_City和i_Age分别建立的单列索引的效率相似。

为了进一步榨取MySQL的效率,就要考虑建立组合索引。就是将vc_Name,vc_City,i_Age建到一个索引里:

ALTER TABLE myIndex ADD INDEXname_city_age (vc_Name(10),vc_City,i_Age);--注意了,建表时,vc_Name长度为50,这里为什么用10呢?因为一般情况下名字的长度不会超过10,这样会加速索引查询速度,还会减少索引文件的大小,提高INSERT的更新速度。

执行T-SQL时,MySQL无须扫描任何记录就到找到唯一的记录!!

肯定有人要问了,如果分别在vc_Name,vc_City,i_Age上建立单列索引,让该表有3个单列索引,查询时和上述的组合索引效率一样吧?嘿嘿,大不一样,远远低于我们的组合索引~~虽然此时有了三个索引,但MySQL只能用到其中的那个它认为似乎是最有效率的单列索引。

建立这样的组合索引,其实是相当于分别建立了

 

vc_Name,vc_City,i_Age

vc_Name,vc_City

vc_Name

 

这样的三个组合索引!为什么没有vc_City,i_Age等这样的组合索引呢?这是因为mysql组合索引"最左前缀"的结果。简单的理解就是只从最左面的开始组合。并不是只要包含这三列的查询都会用到该组合索引,下面的几个T-SQL会用到:

 

SELECT * FROM myIndex WHREEvc_Name="erquan" AND vc_City="郑州"

SELECT * FROM myIndex WHREEvc_Name="erquan"

 

而下面几个则不会用到:

 

SELECT * FROM myIndex WHREEi_Age=20 AND vc_City="郑州"

SELECT * FROM myIndex WHREEvc_City="郑州"

4.使用索引

    到此你应该会建立、使用索引了吧?但什么情况下需要建立索引呢?一般来说,在WHERE和JOIN中出现的列需要建立索引,但也不完全如此,因为MySQL只对 <,<=,=,>,>=,BETWEEN,IN,以及某些时候的LIKE(后面有说明)才会使用索引。

SELECT t.vc_Name FROMtestIndex t LEFT JOIN myIndex m ON t.vc_Name=m.vc_Name WHERE m.i_Age=20 ANDm.vc_City='郑州'时,有对myIndex表的vc_City和i_Age建立索引的需要,由于testIndex表的vc_Name开出现在了JOIN子句中,也有对它建立索引的必要。

刚才提到了,只有某些时候的LIKE才需建立索引?是的。因为在以通配符 % 和 _ 开头作查询时,MySQL不会使用索引,如

 

SELECT * FROM myIndex WHEREvc_Name like'erquan%'

会使用索引,而

SELECT * FROM myIndex WHEREtvc_Name like'%erquan'

就不会使用索引了。

5.索引的不足之处

 

上面说了那么多索引的好话,它真的有像传说中那么优秀么?当然会有缺点了。

    1.虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件

    2.建立索引会占用磁盘空间的索引文件。一般情况这个问题不太严重,但如果你在一个大表上创建了多种组合索引,索引文件的会膨胀很快。

6.其他

    如果有一大堆数据让你去检索其中某一条,比如学生成绩单,按照学号去查考试成绩,最常见的思路是从头查到尾,但是如果数据量很大,当然查起来很慢。但是如果这些数据排好顺序,你还需要从头查到尾么?二分法查起来最快,先查中间,然后看学号是大还是小,然后递次往前或往后二分查找,理解这一点,数据索引对查询效率的影响就豁然开朗了。

0 0
原创粉丝点击