Innodb存储引擎查询输出分析

来源:互联网 发布:mac中文字怎么打 编辑:程序博客网 时间:2024/05/21 10:39

     MySQL查询逻辑以及结果的输出有规律吗?本身问题是不值得讨论的,突然被问到这个问题时,觉得有必要把其深入的实现原理搞明白。因此,通过一些实验进行验证,并跟踪源码,对现有的查询有了深入的理解。

源码分析

查询于存储引擎的实现密切相关,因此,以下内容主要针对Innodb存储引擎的查询处理进行深入研究。对于查询输出的入口点,本文从do_select()sql\sql_select.cc)函数开始。该函数主要用于查询匹配的结果,并将查询结果通过socket传输,或者写到数据表中。

首先看一下调用逻辑,如下所示:

do_select(): 查询入口函数。

| sub_select(): 查询部分join的记录。循环调用ha_innobase::rnd_next()和evaluate_join_record()获取并处理该部分的每条记录。(sql\sql_select.cc:11705)

| | evaluate_join_record(): 处理一条查询记录。(sql\sql_select.cc:11758)

| | rr_sequential():调用ha_innobase::rnd_next()读取下一条记录。(sql\records.cc:452)

| | | ha_innobase::rnd_next(): 读取下一条记录。(storage\innobase\handler\ha_innodb.cc:6141)

| | | | ha_innobase::general_fetch(): 从给定的索引位置获取下一条或上一条记录。(storage\innobase\handler\ha_innodb.cc:5948)

| | | | | row_search_for_mysql(): 从数据库中查询一条记录。以下分为6个阶段分别处理各个部分。(storage\innobase\row\row0sel.c:3369)

| | | | | | 第一阶段:释放自适应hash索引的锁。

| | | | | | | rw_lock_get_writer()函数用于获取读写锁。如果获取失败,释放目前的读写锁。(storage\innobase\include\sync0rw.ic:122)

| | | | | | 第二阶段:从预读的cache中获取记录。

| | | | | | | row_sel_pop_cached_row_for_mysql():函数用于从cache中读取一行记录,(storage\innobase\row\row0sel.c:3167)

| | | | | | | | row_sel_copy_cached_field_for_mysql(): 函数读取每个字段。(storage\innobase\row\row0sel.c:3134)

| | | | | | 第三阶段:使用自适应hash索引快速查找。

| | | | | | | row_sel_try_search_shortcut_for_mysql()函数使用hash索引获取聚集索引的记录。(storage\innobase\row\row0sel.c:3293)

| | | | | | | | row_sel_store_mysql_rec()函数将获取的innobase格式的行记录转化为mysql格式。(storage\innobase\row\row0sel.c:2692)

| | | | | | | | | row_sel_field_store_in_mysql_format()函数将innobase格式的行记录中的每个字段转化为mysql格式。(storage\innobase\row\row0sel.c:2535)

| | | | | | 第四阶段:打开并恢复索引的游标位置。

| | | | | | | sel_restore_position_for_mysql(): 恢复索引的游标位置。(storage\innobase\row\row0sel.c:3070)

| | | | | | | | btr_pcur_restore_position_func(): 恢复一个持久化游标的位置。(storage\innobase\btr\btr0pcur.c:208)

| | | | | | | | | btr_cur_get_index(): 获取索引。(storage\innobase\include\btr0pcur.ic:51)

| | | | | | | | | buf_page_optimistic_get():

| | | | | | | | | btr_pcur_get_rec(): 获取持久化游标的记录。(storage\innobase\include\btr0pcur.ic:104)

| | | | | | | | | | btr_cur_get_rec (): 获取当前游标位置的记录。(storage\innobase\include\btr0pcur.ic:104)

| | | | | | | | | rec_get_offsets_func(): 获取记录中每个字段的偏移。(storage\innobase\rem\rem0rec.c:524)

| | | | | | | | btr_pcur_move_to_next(): 移动持久化游标到下一条记录。(storage\innobase\include\btr0pcur.ic:342)

| | | | | | 第五阶段:查找匹配的记录。

| | | | | | | page_rec_is_infimum(): 查看当前记录是否是该页的infinum记录。infinum记录表示比任何键值都小的记录。(storage\innobase\include\page0page.ic:415)

| | | | | | | page_rec_is_supermum(): 查看当前记录是否是该页的supermum记录。supermum记录表示比任何键值都大的记录。(storage\innobase\include\page0page.ic:403)

| | | | | | | rec_get_next_offs(): 获取相同页中下一条记录的偏移量。(storage\innobase\include\rem0rec.ic:325)

| | | | | | | rec_get_offsets_func(): 获取记录中每个字段的偏移。(storage\innobase\rem\rem0rec.c:524)

| | | | | | | rec_offs_validate():验证记录的偏移量。(storage\innobase\rem\rem0rec.c:954)

| | | | | | | row_sel_store_mysql_rec()函数将获取的innobase格式的行记录转化为mysql格式。(storage\innobase\row\row0sel.c:2692)

| | | | | | | | row_sel_field_store_in_mysql_format()函数将innobase格式的行记录中的每个字段转化为mysql格式。(storage\innobase\row\row0sel.c:2535)

| | | | | | | | btr_pcur_store_position(): 存储游标的位置。(storage\innobase\btr\btr0pcur.c:89)

| | | | | | | | | btr_pcur_get_block(): 获取持久化游标的缓冲块。(storage\innobase\include\btr0pcur.ic:90)

| | | | | | | | | btr_pcur_get_page_cur(): 获取持久化游标的页的游标。(storage\innobase\include\btr0pcur.ic:64)

| | | | | | | | | page_cur_get_rec(): 获取游标位置的记录。(storage\innobase\include\page0cur.ic:76)

| | | | | | | | | dict_index_copy_rec_order_prefix(): 拷贝记录。(storage\innobase\dict\dict0dict.c:4185)

| | | | | | | | | | rec_copy_prefix_to_buf(): 拷贝记录的字段到缓存buffer中。(storage\innobase\rem\rem0rec.c:1383)

| | | | | | | | | | dict_index_get_nth_field(): 获取第n个字段的起始地址。(storage\innobase\include\dict0dict.ic:620)

| | | | | | | | | | dict_field_get_col(): 获取第n个字段的值。(storage\innobase\include\dict0dict.ic:663)

| | | | | | 第六阶段:移动游标到下一个索引记录。

| | | | | | | btr_pcur_move_to_next(): 移动持久化游标到下一条记录。(storage\innobase\include\btr0pcur.ic:342)

| | | | | | | mtr_commit(): 提交事务。(storage\innobase\mtr\mtr0mtr.c:247)

 

       从以上查询逻辑,可以清晰的看出,MySQL的查询时如何进行的。概言之,如果可以从自适应hash索引(在内存中)中得到结果,获取结果从innobase格式转化为mysql格式并输出;否则,根据索引的游标位置,获取当前页中的记录,并拷贝当前记录到内存,同样将结果转化为mysql格式输出。

       从以上内容中,很难看出输出结果有什么规律。实际上,输出的结果是有一定规律的,这种规律与innodb存储引擎的设计和存储密切相关。

innodb存储引擎的存储是按照B+索引将主键作为键值进行聚集存储的,如果不指定主键,系统会隐藏建立一个主键。innodb存储引擎中所有的叶子节点为数据记录,并且数据记录逻辑上可以顺序访问。并且innodb存储引擎的数据存储和获取是按照页来进行的。因此,在查询时,会将整个页的数据加载到内存中,innodb存储引擎的默认页大小为16K。

实验测试

通过以上分析,不难理解,在查询时,简单查询的输出结果是一般按照B+索引的存储顺序排列的。为了进一步的验证,进行一下两个实验

实验1:

以简单的带有主键的数据表student,表定义如下表所示。测试语句以简单的select * from student;为例,进行测试。

 

CREATE TABLE `student` (

  `std_id` int(11) NOT NULL,

  `std_name` varchar(20) NOT NULL DEFAULT '""',

  `std_spec` varchar(20) NOT NULL DEFAULT '""',

  `std_sex` tinyint(4) NOT NULL DEFAULT '0',

  `std_age` tinyint(3) unsigned NOT NULL DEFAULT '0',

  PRIMARY KEY (`std_id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

 

测试结果如下所示:

 

mysql> select * from student;

+------------+----------+-------------+---------+---------+

| std_id     | std_name | std_spec    | std_sex | std_age |

+------------+----------+-------------+---------+---------+

| 2012072301 | aaa      | computer    |       0 |      20 |

| 2012072303 | ccc      | computer    |       1 |      21 |

| 2012072304 | ddd      | computer    |       0 |      20 |

| 2012072305 | eee      | information |       0 |      22 |

| 2012072306 | fff      | computer    |       1 |      20 |

| 2012072307 | ggg      | computer    |       0 |      20 |

| 2012072308 | hhh      | computer    |       0 |      21 |

| 2012072309 | iii      | automatic   |       0 |      20 |

| 2012072310 | abc      | computer    |       1 |      20 |

| 2012072311 | kkk      | computer    |       0 |      18 |

| 2012072312 | lll      | computer    |       0 |      20 |

| 2012072313 | mmm      | computer    |       0 |      20 |

| 2012072314 | nnn      | computer    |       1 |      20 |

| 2012072315 | ooo      | information |       0 |      20 |

| 2012072316 | ppp      | computer    |       0 |      19 |

| 2012072317 | qqq      | computer    |       1 |      20 |

| 2012072318 | rrr      | information |       0 |      20 |

| 2012072319 | sss      | computer    |       1 |      20 |

| 2012072320 | ttt      | computer    |       0 |      20 |

| 2012072321 | uuu      | automatic   |       0 |      23 |

| 2012072322 | vvv      | computer    |       0 |      20 |

| 2012072323 | www      | computer    |       1 |      20 |

| 2012072324 | xxx      | computer    |       0 |      25 |

| 2012072325 | yyy      | automatic   |       0 |      20 |

| 2012072326 | zzz      | computer    |       1 |      20 |

| 2012080811 | bbb      | information |       0 |      20 |

+------------+----------+-------------+---------+---------+

 

实验2

       同样以student表为例,将主键为2012080811的记录更新操作,操作如下:

 

update student set std_id=2012072302 where std_id=2012080811;

 

       然后,在进行测试,测试结果如下所示:

 

+------------+----------+-------------+---------+---------+

| std_id     | std_name | std_spec    | std_sex | std_age |

+------------+----------+-------------+---------+---------+

| 2012072301 | aaa      | computer    |       0 |      20 |

| 2012072302 | bbb      | information |       0 |      20 |

| 2012072303 | ccc      | computer    |       1 |      21 |

| 2012072304 | ddd      | computer    |       0 |      20 |

| 2012072305 | eee      | information |       0 |      22 |

| 2012072306 | fff      | computer    |       1 |      20 |

| 2012072307 | ggg      | computer    |       0 |      20 |

| 2012072308 | hhh      | computer    |       0 |      21 |

| 2012072309 | iii      | automatic   |       0 |      20 |

| 2012072310 | abc      | computer    |       1 |      20 |

| 2012072311 | kkk      | computer    |       0 |      18 |

| 2012072312 | lll      | computer    |       0 |      20 |

| 2012072313 | mmm      | computer    |       0 |      20 |

| 2012072314 | nnn      | computer    |       1 |      20 |

| 2012072315 | ooo      | information |       0 |      20 |

| 2012072316 | ppp      | computer    |       0 |      19 |

| 2012072317 | qqq      | computer    |       1 |      20 |

| 2012072318 | rrr      | information |       0 |      20 |

| 2012072319 | sss      | computer    |       1 |      20 |

| 2012072320 | ttt      | computer    |       0 |      20 |

| 2012072321 | uuu      | automatic   |       0 |      23 |

| 2012072322 | vvv      | computer    |       0 |      20 |

| 2012072323 | www      | computer    |       1 |      20 |

| 2012072324 | xxx      | computer    |       0 |      25 |

| 2012072325 | yyy      | automatic   |       0 |      20 |

| 2012072326 | zzz      | computer    |       1 |      20 |

+------------+----------+-------------+---------+---------+

 

       从以上测试可以看出,当修改主键时,输出的顺序进行了变化。实验1中2012080811记录在最后,将该记录的主键修改为2012072302后,该记录输出为第二行。由此可以验证,Innodb的查询输出原则是按照主键在B+索引叶节点的逻辑位置顺序输出的。

参考资料

1、B+ tree:http://zh.wikipedia.org/zh/B%2B%E6%A0%91

2、page size:http://www.mysqlperformanceblog.com/2006/06/04/innodb-page-size/

原创粉丝点击