mysql数据库索引分类
来源:互联网 发布:手机淘宝注册商家 编辑:程序博客网 时间:2024/06/05 02:17
文章归属:http://feiyan.info/16.html,我想自己去写了,但是发现此君总结的非常详细。直接搬过来了
关于MySQL索引的好处,如果正确合理设计并且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一个人力三轮车。对于没有索引的表,单表查询可能几十万数据就是瓶颈,而通常大型网站单日就可能会产生几十万甚至几百万的数据,没有索引查询会变的非常缓慢。还是以WordPress来说,其多个数据表都会对经常被查询的字段添加索引,比如wp_comments表中针对5个字段设计了BTREE索引。
一个简单的对比测试
以我去年测试的数据作为一个简单示例,20多条数据源随机生成200万条数据,平均每条数据源都重复大概10万次,表结构比较简单,仅包含一个自增ID,一个char类型,一个text类型和一个int类型,单表2G大小,使用MyIASM引擎。开始测试未添加任何索引。
执行下面的SQL语句:
1
mysql>
SELECT
id,FROM_UNIXTIME(
time
)
FROM
article
WHERE
a.title=
'测试标题'
查询需要的时间非常恐怖的,如果加上联合查询和其他一些约束条件,数据库会疯狂的消耗内存,并且会影响前端程序的执行。这时给title字段添加一个BTREE索引:
1
mysql>
ALTER
TABLE
article
ADD
INDEX
index_article_title
ON
title(200);
再次执行上述查询语句,其对比非常明显:
MySQL索引的概念
索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针。更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度。上述SQL语句,在没有索引的情况下,数据库会遍历全部200条数据后选择符合条件的;而有了相应的索引之后,数据库会直接在索引中查找符合条件的选项。如果我们把SQL语句换成“SELECT * FROM article WHERE id=2000000”,那么你是希望数据库按照顺序读取完200万行数据以后给你结果还是直接在索引中定位呢?上面的两个图片鲜明的用时对比已经给出了答案(注:一般数据库默认都会为主键生成索引)。
索引分为聚簇索引和非聚簇索引两种,聚簇索引是按照数据存放的物理位置为顺序的,而非聚簇索引就不一样了;聚簇索引能提高多行检索的速度,而非聚簇索引对于单行的检索很快。
MySQL索引的类型
1. 普通索引
这是最基本的索引,它没有任何限制,比如上文中为title字段创建的索引就是一个普通索引,MyIASM中默认的BTREE类型的索引,也是我们大多数情况下用到的索引。
01
–直接创建索引
02
CREATE
INDEX
index_name
ON
table
(
column
(length))
03
–修改表结构的方式添加索引
04
ALTER
TABLE
table_name
ADD
INDEX
index_name
ON
(
column
(length))
05
–创建表的时候同时创建索引
06
CREATE
TABLE
`
table
` (
07
`id`
int
(11)
NOT
NULL
AUTO_INCREMENT ,
08
`title`
char
(255)
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NOT
NULL
,
09
`content` text
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NULL
,
10
`
time
`
int
(10)
NULL
DEFAULT
NULL
,
11
PRIMARY
KEY
(`id`),
12
INDEX
index_name (title(length))
13
)
14
–删除索引
15
DROP
INDEX
index_name
ON
table
2. 唯一索引
与普通索引类似,不同的就是:索引列的值必须唯一,但允许有空值(注意和主键不同)。如果是组合索引,则列值的组合必须唯一,创建方法和普通索引类似。
01
–创建唯一索引
02
CREATE
UNIQUE
INDEX
indexName
ON
table
(
column
(length))
03
–修改表结构
04
ALTER
TABLE
table_name
ADD
UNIQUE
indexName
ON
(
column
(length))
05
–创建表的时候直接指定
06
CREATE
TABLE
`
table
` (
07
`id`
int
(11)
NOT
NULL
AUTO_INCREMENT ,
08
`title`
char
(255)
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NOT
NULL
,
09
`content` text
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NULL
,
10
`
time
`
int
(10)
NULL
DEFAULT
NULL
,
11
PRIMARY
KEY
(`id`),
12
UNIQUE
indexName (title(length))
13
);
3. 全文索引(FULLTEXT)
MySQL从3.23.23版开始支持全文索引和全文检索,FULLTEXT索引仅可用于 MyISAM 表;他们可以从CHAR、VARCHAR或TEXT列中作为CREATE TABLE语句的一部分被创建,或是随后使用ALTER TABLE 或CREATE INDEX被添加。////对于较大的数据集,将你的资料输入一个没有FULLTEXT索引的表中,然后创建索引,其速度比把资料输入现有FULLTEXT索引的速度更为快。不过切记对于大容量的数据表,生成全文索引是一个非常消耗时间非常消耗硬盘空间的做法。
01
–创建表的适合添加全文索引
02
CREATE
TABLE
`
table
` (
03
`id`
int
(11)
NOT
NULL
AUTO_INCREMENT ,
04
`title`
char
(255)
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NOT
NULL
,
05
`content` text
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NULL
,
06
`
time
`
int
(10)
NULL
DEFAULT
NULL
,
07
PRIMARY
KEY
(`id`),
08
FULLTEXT (content)
09
);
10
–修改表结构添加全文索引
11
ALTER
TABLE
article
ADD
FULLTEXT index_content(content)
12
–直接创建索引
13
CREATE
FULLTEXT
INDEX
index_content
ON
article(content)
4. 单列索引、多列索引
多个单列索引与单个多列索引的查询效果不同,因为执行查询时,MySQL只能使用一个索引,会从多个索引中选择一个限制最为严格的索引。
5. 组合索引(最左前缀)
平时用的SQL查询语句一般都有比较多的限制条件,所以为了进一步榨取MySQL的效率,就要考虑建立组合索引。例如上表中针对title和time建立一个组合索引:ALTER TABLE article ADD INDEX index_titme_time (title(50),time(10))。建立这样的组合索引,其实是相当于分别建立了下面两组组合索引:
–title,time
–title
为什么没有time这样的组合索引呢?这是因为MySQL组合索引“最左前缀”的结果。简单的理解就是只从最左面的开始组合。并不是只要包含这两列的查询都会用到该组合索引,如下面的几个SQL所示:
1
–使用到上面的索引
2
SELECT
*
FROM
article WHREE title=
'测试'
AND
time
=1234567890;
3
SELECT
*
FROM
article WHREE utitle=
'测试'
;
4
–不使用上面的索引
5
SELECT
*
FROM
article WHREE
time
=1234567890;
MySQL索引的优化
上面都在说使用索引的好处,但过多的使用索引将会造成滥用。因此索引也会有它的缺点:虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件。建立索引会占用磁盘空间的索引文件。一般情况这个问题不太严重,但如果你在一个大表上创建了多种组合索引,索引文件的会膨胀很快。索引只是提高效率的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询语句。下面是一些总结以及收藏的MySQL索引的注意事项和优化方法。
1. 何时使用聚集索引或非聚集索引?
动作描述使用聚集索引使用非聚集索引列经常被分组排序使用使用返回某范围内的数据使用不使用一个或极少不同值不使用不使用小数目的不同值使用不使用大数目的不同值不使用使用频繁更新的列不使用使用外键列使用使用主键列使用使用频繁修改索引列不使用使用事实上,我们可以通过前面聚集索引和非聚集索引的定义的例子来理解上表。如:返回某范围内的数据一项。比如您的某个表有一个时间列,恰好您把聚合索引建立在了该列,这时您查询2004年1月1日至2004年10月1日之间的全部数据时,这个速度就将是很快的,因为您的这本字典正文是按日期进行排序的,聚类索引只需要找到要检索的所有数据中的开头和结尾数据即可;而不像非聚集索引,必须先查到目录中查到每一项数据对应的页码,然后再根据页码查到具体内容。其实这个具体用法我还不是很理解,只能等待后期的项目开发中慢慢学学了。
2. 索引不会包含有NULL值的列
只要列中包含有NULL值都将不会被包含在索引中,复合索引中只要有一列含有NULL值,那么这一列对于此复合索引就是无效的。所以我们在数据库设计时不要让字段的默认值为NULL。
3. 使用短索引
对串列进行索引,如果可能应该指定一个前缀长度。例如,如果有一个CHAR(255)的列,如果在前10个或20个字符内,多数值是惟一的,那么就不要对整个列进行索引。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。
4. 索引列排序
MySQL查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作;尽量不要包含多个列的排序,如果需要最好给这些列创建复合索引。
5. like语句操作
一般情况下不鼓励使用like操作,如果非使用不可,如何使用也是一个问题。like “%aaa%” 不会使用索引而like “aaa%”可以使用索引。
6. 不要在列上进行运算
例如:select * from users where YEAR(adddate)<2007,将在每个行上进行运算,这将导致索引失效而进行全表扫描,因此我们可以改成:select * from users where adddate<’2007-01-01′。关于这一点可以围观:一个单引号引发的MYSQL性能损失。
最后总结一下,MySQL只对一下操作符才使用索引:<,<=,=,>,>=,between,in,以及某些时候的like(不以通配符%或_开头的情形)。而理论上每张表里面最多可创建16个索引,不过除非是数据量真的很多,否则过多的使用索引也不是那么好玩的,比如我刚才针对text类型的字段创建索引的时候,系统差点就卡死了。
昨天有位同事说,他的网页查询过程中发现普通索引和唯一索引的效率是有差别的,普通索引比唯一索引快,
今天在我的虚拟机中布置了环境,测试抓图如下:
抓的这几个都是第一次执行的,刷了几次后,取平均值,效率大致相同,而且如果在一个列上同时建唯一索引和普通索引的话,mysql会自动选择唯一索引。
谷歌一下:
唯一索引和普通索引使用的结构都是B-tree,执行时间复杂度都是O(log n)。
补充下概念:
1、普通索引
普通索引(由关键字KEY或INDEX定义的索引)的唯一任务是加快对数据的访问速度。因此,应该只为那些最经常出现在查询条件(WHEREcolumn=)或排序条件(ORDERBYcolumn)中的数据列创建索引。只要有可能,就应该选择一个数据最整齐、最紧凑的数据列(如一个整数类型的数据列)来创建索引。
2、唯一索引
普通索引允许被索引的数据列包含重复的值。比如说,因为人有可能同名,所以同一个姓名在同一个“员工个人资料”数据表里可能出现两次或更多次。
如果能确定某个数据列将只包含彼此各不相同的值,在为这个数据列创建索引的时候就应该用关键字UNIQUE把它定义为一个唯一索引。这么做的好处:一是简化了MySQL对这个索引的管理工作,这个索引也因此而变得更有效率;二是MySQL会在有新记录插入数据表时,自动检查新记录的这个字段的值是否已经在某个记录的这个字段里出现过了;如果是,MySQL将拒绝插入那条新记录。也就是说,唯一索引可以保证数据记录的唯一性。事实上,在许多场合,人们创建唯一索引的目的往往不是为了提高访问速度,而只是为了避免数据出现重复。
注:
终于找到同事说执行效率不一样的原因了,他在普通索引上创建的是前缀索引,只取了前16个字节,而唯一索引使用的全字节 :)
相关文档:
http://www.cnblogs.com/sunss/archive/2010/12/04/1896270.html
http://blog.csdn.net/xluren/article/details/32746183
- mysql数据库索引分类
- 数据库索引分类
- 数据库索引及分类
- MySQL 索引的分类
- mysql索引分类
- mysql索引分类
- mysql索引分类
- MYSQL索引分类介绍
- 数据库索引概念和分类
- mysql索引含义及分类
- mysql数据库约束分类
- MySQL数据库索引总结
- mysql数据库 索引
- MySQL数据库索引
- MySql数据库索引原理
- MySql数据库 索引原理
- MYSQL数据库索引类型
- mysql数据库索引
- 关闭迅雷9以上版本的首页自动播放
- web 网站调用web service时出错,连接不上
- ionic2--常用装饰器
- kafka中重要的参数配置 (记录)
- 命令行输入ipconfig显示“不是内部或外部命令”的解决方法
- mysql数据库索引分类
- android驱动初探(kernel->hal->jni->service->app)
- Hibernate 关系映射 总结整理
- Image uImage与zImage的区别
- C语言标准库函数--数学函数、字符(串)处理函数
- Sublime Text 3 快捷键精华版
- 回炉再造,灵活的YMenuView2.0诞生
- 实现三级菜单联动综合代码
- mysql 时区转换