编写SQL查询的关键—SQL语句的执行顺序

来源：互联网发布：python jupyter 编辑：程序博客网时间：2024/06/11 18:12

【文章标题】编写SQL查询的关键—SQL语句的执行顺序

【文章作者】曾健生

【作者邮箱】zengjiansheng1@126.com

【作者QQ】190678908

【作者MSN】zengjiansheng1@hotmail.com

【作者博客】blog.csdn.net/newjueqi

*******************************************************************************

编写SQL语句是每个程序员应该具备的基本功。在实际开发过程中，需要编写比较复杂的SQL查询语句是必不可少的，但很多SQL书籍上不是简单的介绍一下就是出最终的查询语句，编写复杂SQL查询的具体思路却没有多少介绍，这不能不说是一种巨大的遗憾,看着一串无比复杂的SQL语句，没有掌握方法的话谁看了都会头晕^-^

回忆一下学习编程语言的经历（C++,java等），我们一般都是先学习变量的定义，然后是流程控制语句，接着是函数，类等等。但我们在学习SQL，SQL书籍上都普遍忽略了一个重要的方面：SQL语句的执行顺序。不知道是什么原因，这一点确实没被多少书籍提过。掌握了ＳＱＬ语句的执行顺序的规律，就能较轻松的编写出复杂的SQL查询。

SQL语句的执行顺序如下：

1、from子句组装来自不同数据源的数据；

2、where子句基于指定的条件对记录行进行筛选；

3、group by子句将数据划分为多个分组；

4、使用聚集函数进行计算；

5、使用having子句筛选分组；

6、计算所有的表达式；

7、使用order by对结果集进行排序。

下面举一个简单的例子举例说明，假设有以下一张表student：

Name

Age

Tom

Jack

Lucy

Anay

Bobby

要求通过SQL语句把年龄大于20的学生姓名查出来

SQL语句如下：

Select name

From student

Where age>20

结果是：

Tom

Jack

Bobby

那对于这个简单的SQL语句，执行顺序是怎么样的呢？

1. from子句组装来自不同数据源的数据，简单点来说就是要确定查询的数据来自哪个表。如果from关键字后跟的表有两个或以上，就产生笛卡尔积。

2. where子句对每个记录行进行筛选，把不符合条件的行筛选掉。

3. 针对符合条件的行执行相应的表达式操作，即select 部分。

我们针对前面的写的SQL语句简单模拟一下执行过程：

1. 确定数据表，我们能根据from子句（Fromstudent）确定数据是来自下面的的表student

Name

Age

Tom

Jack

Lucy

Anay

Bobby

表1

2. 根据where子句中的条件（Where age>20）筛选记录行，请留意，where子句的筛选是对每一行from表中的每一行进行的。

（1）对于第1行

Tom

Age=23>20, 符合条件

（2）对于第2行

Jack

Age=25>20, 符合条件

（3）对于第3行

Lucy

Age=15<20, 不符合条件

（4）对于第4行

Anay

Age=18<20, 不符合条件

（5）对于第5行

Bobby

Age=21>20, 符合条件

由上述的(1)(2)(5)可知，最终符合条件的记录为下表2

Name

Age

Tom

Jack

Bobby

表2

4. 计算所有的表达式，即Select name部分，针对表2中的数据，最终符合条件的是3行，分别从每一行挑选出需要的字段值name，最终的结果如下表3

Name

Tom

Jack

Bobby

表3

下面举一般比较复杂的例子，有3个表 teacher 表，student表，tea_stu关系表：

teacher 表 teaID nameage
student 表 stuID nameage
teacher_student表 teaID stuID

要求用一条sql查询出这样的结果
1.显示的字段要有老师name, 每个老师所带的学生人数
2 只列出老师age为45以下，学生age为12以上的记录

先准备测试数据：

drop table if exists tea_stu;

droptable if exists teacher;

droptable if exists student;

create table teacher(teaID int primary key,name varchar(50),age int);

create table student(stuID int primary key,name varchar(50),age int);

create table tea_stu(teaID int references teacher(teaID),stuID intreferences student(stuID));

insert into teacher values(1,' Tom',46), (2,'Jack',35) , (3,' Tony',36) , (4,' Lucy',37);

insert into student values(1,' Lili',11),(2,' Anay',15) , (3, 'Bobby',16) , (4, 'Jeff',17);

insert into tea_stu values(1,1), (1,2),(1,3),(2,2), (2,3), (2,4),(3,3), (3,4), (3,1),(4,4), (4,1), (4,2) , (4,3);

题目要求是列出老师所带的学生数，条件是老师age为45以下，学生age为12以上，最理想的情况是有下面的一个表,如图1

图1

如果能构造一个图1的表，那么实现题目要求的SQL语句用下面的简单SQL查询就行：

select teacher.name, count(student.name)

from table

where teacher.age<45

andstudent.age>12

group by teacher.name;

数据库中学生的信息和老师的信息是分别存放在student, teacher表中的，信息的关联只能依靠tea_stu，那么怎么构造图1的表呢？这时候可以用到表的关联，把这三个表的数据关联起来，注意：只要是表的关联就会产生笛卡尔积，所以务必把笛卡尔积去掉。关联表的最小粒度关联可以去掉笛卡尔积，具体的查询语句为：

select teacher.name,teacher.age,student.name,student.age

from teacher,student,tea_stu

where teacher.teaID=tea_stu.teaID

andstudent.stuID=tea_stu.stuID

所以综合以上所述，就能得出最终的查询语句

selectteacher.name, count(student.name) student_num

fromteacher,student,tea_stu

whereteacher.teaID=tea_stu.teaID

and student.stuID=tea_stu.stuID

and teacher.age<45

and student.age>12

group byteacher.name;

结果如图2所示：

图2