MySQL技术内幕-InnoDB存储引擎读写笔记(性能调优)

来源：互联网发布：淘宝网评价管理网页. 编辑：程序博客网时间：2024/06/03 05:07

1、CPU

数据库一般是IO密集型的，其性能瓶颈在于IO。数据库服务器的选购偏内存，CPU可以适当降低其要求。

InnoDB存储引擎相关后台线程：

show engine innodb status\G;

1、插入缓冲区线程 http://www.cnblogs.com/yuyue2014/p/3802779.html

InnoDB insert buffer thread 线程主要是更新非唯一索引的索引数据，避免频繁随机的读写索引文件。（索引数据存放在表默认表空间中）

log thread : InnoDB的默认指的就是redo日志,log thread 就是写 redo 日志的线程。

read thread | write thread 读、写日志线程（文件《----》内存）

根据CPU适当调节innodb_read_io_threads与innodb_write_io_threads

2、内存

内存的大小最能直接反应数据库的性能。InnoDB存储引擎既缓存数据，又缓存索引（存放在数据文件中，表空间），并放入一个很大的缓冲池中(InnoDB Buffer Pool)。【innodb_buffer_pool的大小如果能等于数据文件的大小，则能缓存所有的数据文件，性能会得到极高的提升】（innodb_buffer_pool_size）,如何判断当前数据库的内存是否达到了瓶颈了呢。

mysql提供 show global status 命令查看系统运行状况监控，（INFORMATION_SCHEMA GLOBAL_STATUS临时表）。

关注如下参数：

innodb_buffer_pool_reads: 从物理磁盘读取页的次数

innodb_buffer_pool_read_ahead:预读的次数

innodb_buffer_pool_read_ahead_evicted:预读的页，但没有被读取就从缓冲区被替换的也的数量，一般用来判断预读的效率。

innodb_buffer_pool_read_requests:从缓冲池中读取页的次数（可以理解为缓冲命中次数）

innodb_data_read:总共读入的字节数

innodb_data_reads:发起读请求的次数

预读的效率：(1 - (innodb_buffer_pool_read_ahead / innodb_buffer_pool_read)) * 100 %

InnoDB缓存命中率： innodb_buffer_pool_read_requests / ( innodb_buffer_pool_read_requests + innodb_buffer_pool_reads + innodb_buffer_pool_read_ahead ) * 100 %,

InnoDB缓存命中率通常要保持在99%以上，才表明内存无压力，这样性能杠杠的。

平均每次读取的字节数= innodb_data_read/innodb_data_reads

内存大于数据文件，并不意味着没有IO操作，Innodb会定时刷脏（将被修改的页刷写到数据文件），并且每次

事务提交，会写redo日志。

3、磁盘对数据库性能的影响

数据库是IO密集型应用，推荐使用raid10(磁盘冗余阵列)

4、SQL语句优化

SQL语句的优化点基本上会落到是否能利用索引这个问题上来。

1）养成好的SQL使用习惯

a、禁止使用 select *，应写需要的数据字段。

b、尽量使用exists代替in

2）尽量利用索引来加速SQL数据的查询效率

以下情况将无法利用索引：

a、不支持 != 表达式，如果使用不等于，无法利用到索引。索引的存储结构是B+树，支持等值查询与范围查询。

b、like '%a%'无法利用索引，但'a%'可以使用索引。

原因分析，索引的存储结构是B+树，叶子节点存放数据，数据本身是排序的，输入值必须是一个明确的值，方便对比，a%开头的查询，是可以用a当查询关键字首先定位记录的，但%a%无法定位。

c、复合索引，查询条件必须包含第一列（最左列）

道理是一样的，索引的优势就是天生是排序的，查询类似于二分查询（每比较一次，就会缩短查询范围）。

例如有两列的复合索引类似( 1, 1 ) ( 1, 3 ) ( 2, 1 ) ( 2, 5 ) ( 3, 1 ) 只有包含第一列，整个二元序列就是有序的，但如果剔除第一列，那序列为 1,3,1,5,1，无序序列的查找，复杂度为o(n)。

d、对字段使用表达式或函数允许，将无法使用索引

3）索引建立原则

a、列高选择性（重复率低）

b、频繁查询的列

c、order by 或 group by字段（利用索引的有序性）

5、MySQL执行计划解读

MySQL提供explain查看查询语句的执行计划，使用案例如下：

EXPLAIN SELECT

t.id,

t.order_no,

t.total_price,

t.seller_id,

t.creator,

t.create_time

FROM

(

SELECT

a.id,

a.order_no,

a.total_price,

a.seller_id,

a.creator,

a.create_time

FROM

es_order a

WHERE

a.seller_id = 24

LIMIT 20,

) t

INNER JOIN es_order_item b ON b.order_id = t.id

相关字段：id、select_type、table、type、prossible_keys、key、ken_len、ref、rows、Extr

1） id : 执行顺序，数字越大，先执行。

2） select_type: (只是标记为查询类型)

simple : 查询中不包含子查询或union

primary:若查询中包含任何复杂的子查询，最外层查询标记为：PRIMARY

subquery:子查询

derived:驱动表，不是真实的物理表，但不同于临时表

union:

union result

3）type:访问类型，重点关注

取值如下：all、index、range、ref、 eq_ref、 const system、null

all : 全表扫描

index: Full Index Scan,index与all的区别为index只遍历索引树。

例如：(select a.id from es_order a)

range:索引范围扫描，常见于索引字段上的 between > < like( like 'a%')

ref : 非唯一索引的等值匹配，例如a.seller_id=24 (seller_id上建有索引)

eq_ref:唯一索引的等值匹配

const、system:当MySQL对查询某部分进行优化，并转换为一个常量时，使用这些类型访问。

explain select a.id,a.name from es_order a where a.id=8078

null : 不需要访问表，索引等。

4）possible_keys

指出mysql能使用哪个索引能在表中找到行，查询涉及到的字段若存在索引，则会列出，但不一定使用

5）key （重点关注）

使用到的索引

6）key_len (索引用到的长度)

7 ）ref 索引匹配的情况（列）【无需太关注】

8）rows

本次查询，预计需要扫描的行数

9）Extra 额外的说明信息

using index (covering Index)

using where

表示mysql服务器从存储引擎收到记录后，进行“后过滤”，如果未使用索引，提醒

Using temporary

表示使用了临时表空间（排序、分组）

Using filesort

Mysql中无法利用索引完成的排序操作成为文件排序。

6、数据库设计心得

1）数据库的表的设计方法论为理解ER关系

一对一、一对多、多对对（分拆成两个1对多关系，也就是引入一个关系实体）

2）适当打破数据库第三范式

适当增加冗余字段，减少表的连接操作。

举例：订单表中有商品ID，由于订单反映的当时下单时商品的信息，我们完成可以增加一个冗余字段，商品名称goods_name,这样在展示订单信息

时，无需join商品信息表。（冗余字段的增加可能会带来数据的不一致性，所以要结合实际情况，不能为了冗余而冗余）

3）数据库字段类型选择

尽量选择满足需求的最小长度。比如订单状态，可以使用tinyint,而无需使用int。这样的直接好处就是减少数据行的长度，每页能存储更多的数据

行，IO效率得到提高。（性能是一个积累的过程）

4）表的垂直分割

将一个表的信息分割成多个表，这样主要是保证频繁使用的主表每行的数据尽量少，每页存放更多数据行，提高IO读效率。

表分割后，如果每次查询主表，都需要连接查询从表，那就没有必要进行垂直分割。

举例：

比如一条资讯信息，咨询的内容使用的类型为(text)，在实际使用时，一般是先出资讯列表，然后点击到每一条资讯时，才去查询资讯内容，此时

可以将咨询内容单独分割出一张表，在咨询主表中冗余一个字段（摘要），存放咨询内容的部分信息，用于列表展示。

反例：

比如一条评论，有评论内容，类型为text,此时就没必要单独将评论内容抽取出来，因为每次显示评论时，基本上都要查看全部的评论内容，如果

分开，会进行多边连接，性能反而受影响。

5）表设计阶段应该考虑索引的建立

应根据系统相关需求，在创建表时建立必要的索引。

阅读全文

0 0