mysql

来源：互联网发布：淘宝子账号名字大全编辑：程序博客网时间：2024/06/05 16:35

刚开始接触一个新的事物的时候，我觉得很有必要从其工作原理入手，弄清楚这个东西的来龙去脉，为了接下来的继续深入学习做好铺垫，掌握好其原理有助于我们从整体上来把握这个东西，并且帮助我们在排错过程中理清思路。
经典的图片

上面的图就是mysql的内部架构，可以清楚的看到mysql是由SQL接口，解析器，优化器，缓存和存储引擎组成的。

下面是关于上述部件的介绍：

（1）connectors
和其他编程语言中的sql语句进行交互，如PHP，java等；

（2）Management Serverices & Utilities
系统管理和控制工具

（3）Connecttion Pool【连接池】
管理缓冲用户连接，线程处理等需要缓存的需求

（4）SQL Interface【SQL接口】
接受用户的SQL命令，并且返回用户需要查询的结果。比如select from就是调用SQL Interface来处理的；

（5）Parser【解析器】
SQL命令传递到解析器的时候会被解析器验证和解析。
主要功能如下：
a，将SQL语句分解成数据结构，并将这个结构传递到后续步骤，后面SQL语句的传递和处理就是基于这个结构的；
b，如果在分解构成中遇到错误，那么就说明这个SQL语句是不合理的，语句将不会继续执行下去；

（6）Optimizer【查询优化器】
SQL语句在查询之前会使用查询优化器对查询进行优化（这会产生多种执行计划，最终数据库会选择最优化的方案去执行，尽快返回结果）数据库使用的是“选取-投影-联接”的策略进行查询。

用一个例子就可以理解上面所说的意思：
例如查询语句如：select uid,name from user where gender = 1;
a，这个select查询先会根据where语句进行选取，而不是先将表全部查询出来以后再进行gender过滤；
b，这个select查询先根据uid和name进行属性投影，而不是将属性全部取出来以后再进行过滤；
c，将这个两个查询条件联接起来生成最终查询结果；

这就是所谓的“选取-投影-联接”的策略；

（7）Cache和Buffer【查询缓存】
如果查询缓存有命中的查询结果，查询语句就可以直接去查询缓存中取数据；
这个缓存机制是由一些列小缓存组成的。比如表缓存，记录缓存，key缓存和权限缓存等；

（8）Engine【存储引擎】
存储引擎是mysql中具体的和文件打交道的子系统。也是mysql最具特色的一个地方。
mysql的存储引擎是插件式的。它根据mysql ab公司提供的文件访问层的一个抽象接口来定制一种文件访问机制（这种访问机制就叫存储引擎）；

SQL语句执行过程

数据库通常不会被直接使用，而是由其他编程语言通过SQL语句调用mysql，由mysql处理并返回执行结果。那么，mysql接收到SQL语句之后，又是如何处理的呢？【重点理解】

首先程序的请求会通过mysql的connectors与其进行交互【例如PHP就是通过扩展extension中的mysql.dll或者mysqli.dll，还有PDO等等】。请求之后，会暂时存放在连接池（Connection Pool）中，并由处理器（Management Serveices & Utilities）进行调度管理。当该请求从等待队列进入到处理队列，管理器会将该请求丢给SQL接口（SQL Interface）。SQL接口接收到请求之后，它会请求进行hash处理并会与缓存中的结果进行对比，如果完全匹配则通过缓存直接返回处理结果；否则，需要完整的走一趟流程了；

（1）由SQL接口丢给后面的解析器（Parser），上面已经说到，解析器会判断SQL语句正确与否，若正确则将其转化为数据结构；
（2）解析器（Parser）处理完，便来到后面的优化器（Optimizer），它会产生多种执行计划，但是最终数据库会选择最优化的方案去执行，尽快返回结果；
（3）确定最优执行计划之后，SQL语句此时便可以交给由存储引擎（Engine）处理，储存引擎将会到后端的存储设备中取得相应的数据，并按照原路返回给程序；

这里有几点需要注意：
a，如何缓存查询数据？
存储引擎处理完数据，并将其返回给程序的同事，它还会将一份数据保留在缓存中，以便更快速的处理下一次相同的请求。具体情况是，mysql会将查询的语句，执行结果等操作会进行hash处理，并保留在cache中，等待下次查询。

b，buffer和cache的区别？
从上面的图可以看出，缓存哪里实际上有buffer和cache两个，那他们之间是否有什么不同呢？我们可以先简单来理解一下，buffer是写缓存，cache是读缓存。

c，如何判断缓存中是否已经缓存需要的数据？
这里可能会有一个误区，觉得处理SQL语句的时候，为了判断是否已经缓存了查询结果，会将整个流程走一遍，取得执行结果后再与需要的进行比对，看看是否命中，并以此说，既然不管缓存中有没有缓存到查询内容，都要整个流程走一遍，那么缓存的优势在哪里？？？

实际上，并非如此。在第一次查询之后，mysql便将查询语句以及查询结构都进行了hash处理并保留在缓存中，SQL查询到达之后，对其进行同样的hash处理，将两个hash值进行对照，如果一样，则命中，从缓存中返回查询结果；否则，需要继续往下交给解析器（Parser），优化器（Optimizer），最后交给存储引擎处理返回结果再进行缓存这样的流程走一遍。

参考地址：http://www.cnblogs.com/xiaotengyi/articles/3641983.html

0 0