mysql

来源:互联网 发布:淘宝子账号名字大全 编辑:程序博客网 时间:2024/06/05 16:35

刚开始接触一个新的事物的时候,我觉得很有必要从其工作原理入手,弄清楚这个东西的来龙去脉,为了接下来的继续深入学习做好铺垫,掌握好其原理有助于我们从整体上来把握这个东西,并且帮助我们在排错过程中理清思路。
经典的图片

上面的图就是mysql的内部架构,可以清楚的看到mysql是由SQL接口,解析器,优化器,缓存和存储引擎组成的。

下面是关于上述部件的介绍:

(1)connectors
和其他编程语言中的sql语句进行交互,如PHP,java等;

(2)Management Serverices & Utilities
系统管理和控制工具

(3)Connecttion Pool【连接池】
管理缓冲用户连接,线程处理等需要缓存的需求

(4)SQL Interface【SQL接口】
接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface来处理的;

(5)Parser【解析器】
SQL命令传递到解析器的时候会被解析器验证和解析。
主要功能如下:
a,将SQL语句分解成数据结构,并将这个结构传递到后续步骤,后面SQL语句的传递和处理就是基于这个结构的;
b,如果在分解构成中遇到错误,那么就说明这个SQL语句是不合理的,语句将不会继续执行下去;

(6)Optimizer【查询优化器】
SQL语句在查询之前会使用查询优化器对查询进行优化(这会产生多种执行计划,最终数据库会选择最优化的方案去执行,尽快返回结果)数据库使用的是“选取-投影-联接”的策略进行查询。

用一个例子就可以理解上面所说的意思:
例如查询语句如:select uid,name from user where gender = 1;
a,这个select查询先会根据where语句进行选取,而不是先将表全部查询出来以后再进行gender过滤;
b,这个select查询先根据uid和name进行属性投影,而不是将属性全部取出来以后再进行过滤;
c,将这个两个查询条件联接起来生成最终查询结果;

这就是所谓的“选取-投影-联接”的策略;

(7)Cache和Buffer【查询缓存】
如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据;
这个缓存机制是由一些列小缓存组成的。比如表缓存,记录缓存,key缓存和权限缓存等;

(8)Engine【存储引擎】
存储引擎是mysql中具体的和文件打交道的子系统。也是mysql最具特色的一个地方。
mysql的存储引擎是插件式的它根据mysql ab公司提供的文件访问层的一个抽象接口来定制一种文件访问机制(这种访问机制就叫存储引擎)

SQL语句执行过程

数据库通常不会被直接使用,而是由其他编程语言通过SQL语句调用mysql,由mysql处理并返回执行结果。那么,mysql接收到SQL语句之后,又是如何处理的呢?【重点理解】

首先程序的请求会通过mysql的connectors与其进行交互【例如PHP就是通过扩展extension中的mysql.dll或者mysqli.dll,还有PDO等等】。请求之后,会暂时存放在连接池(Connection Pool)中,并由处理器(Management Serveices & Utilities)进行调度管理。当该请求从等待队列进入到处理队列,管理器会将该请求丢给SQL接口(SQL Interface)SQL接口接收到请求之后,它会请求进行hash处理并会与缓存中的结果进行对比,如果完全匹配则通过缓存直接返回处理结果否则,需要完整的走一趟流程了;

(1)由SQL接口丢给后面的解析器(Parser),上面已经说到,解析器会判断SQL语句正确与否,若正确则将其转化为数据结构;
(2)解析器(Parser)处理完,便来到后面的优化器(Optimizer),它会产生多种执行计划,但是最终数据库会选择最优化的方案去执行,尽快返回结果;
(3)确定最优执行计划之后,SQL语句此时便可以交给由存储引擎(Engine)处理,储存引擎将会到后端的存储设备中取得相应的数据,并按照原路返回给程序;

这里有几点需要注意:
a,如何缓存查询数据?
存储引擎处理完数据,并将其返回给程序的同事,它还会将一份数据保留在缓存中,以便更快速的处理下一次相同的请求。具体情况是,mysql会将查询的语句,执行结果等操作会进行hash处理,并保留在cache中,等待下次查询。

b,buffer和cache的区别?
从上面的图可以看出,缓存哪里实际上有buffer和cache两个,那他们之间是否有什么不同呢?我们可以先简单来理解一下,buffer是写缓存,cache是读缓存

c,如何判断缓存中是否已经缓存需要的数据?
这里可能会有一个误区,觉得处理SQL语句的时候,为了判断是否已经缓存了查询结果,会将整个流程走一遍,取得执行结果后再与需要的进行比对,看看是否命中,并以此说,既然不管缓存中有没有缓存到查询内容,都要整个流程走一遍,那么缓存的优势在哪里???

实际上,并非如此。在第一次查询之后,mysql便将查询语句以及查询结构都进行了hash处理并保留在缓存中,SQL查询到达之后,对其进行同样的hash处理,将两个hash值进行对照,如果一样,则命中,从缓存中返回查询结果;否则,需要继续往下交给解析器(Parser),优化器(Optimizer),最后交给存储引擎处理返回结果再进行缓存这样的流程走一遍。

参考地址:http://www.cnblogs.com/xiaotengyi/articles/3641983.html

0 0
原创粉丝点击