编写SQL查询的关键—SQL语句的执行顺序

来源:互联网 发布:python jupyter 编辑:程序博客网 时间:2024/06/11 18:12

【文章标题】编写SQL查询的关键—SQL语句的执行顺序

【文章作者】曾健生

【作者邮箱】zengjiansheng1@126.com

【作者QQ190678908

【作者MSNzengjiansheng1@hotmail.com

【作者博客】blog.csdn.net/newjueqi

 

*******************************************************************************

    编写SQL语句是每个程序员应该具备的基本功。在实际开发过程中,需要编写比较复杂的SQL查询语句是必不可少的,但很多SQL书籍上不是简单的介绍一下就是出最终的查询语句,编写复杂SQL查询的具体思路却没有多少介绍,这不能不说是一种巨大的遗憾,看着一串无比复杂的SQL语句,没有掌握方法的话谁看了都会头晕^-^

回忆一下学习编程语言的经历(C++,java等),我们一般都是先学习变量的定义,然后是流程控制语句,接着是函数,类等等。但我们在学习SQLSQL书籍上都普遍忽略了一个重要的方面:SQL语句的执行顺序。不知道是什么原因,这一点确实没被多少书籍提过。掌握了SQL语句的执行顺序的规律,就能较轻松的编写出复杂的SQL查询。

 

SQL语句的执行顺序如下:

 

1from子句组装来自不同数据源的数据;

2where子句基于指定的条件对记录行进行筛选;

3group by子句将数据划分为多个分组;

4、使用聚集函数进行计算;

5、使用having子句筛选分组;

6、计算所有的表达式;

7、使用order by对结果集进行排序。

 

下面举一个简单的例子举例说明,假设有以下一张表student

 

ID

Name

Age

1

Tom

23

2

Jack

25

3

Lucy

15

4

Anay

18

5

Bobby

21

 

要求通过SQL语句把年龄大于20的学生姓名查出来

 

SQL语句如下:

 

Select name

From student

Where age>20

结果是:

Tom

Jack

Bobby

 

那对于这个简单的SQL语句,执行顺序是怎么样的呢?

1.       from子句组装来自不同数据源的数据,简单点来说就是要确定查询的数据来自哪个表。如果from关键字后跟的表有两个或以上,就产生笛卡尔积。

2.      where子句对每个记录行进行筛选,把不符合条件的行筛选掉。

3.      针对符合条件的行执行相应的表达式操作,即select 部分。

 

我们针对前面的写的SQL语句简单模拟一下执行过程:

1. 确定数据表,我们能根据from子句(Fromstudent)确定数据是来自下面的的表student

   

ID

Name

Age

1

Tom

23

2

Jack

25

3

Lucy

15

4

Anay

18

5

Bobby

21

                                    1

 

2. 根据where子句中的条件(Where age>20)筛选记录行,请留意,where子句的筛选是对每一行from表中的每一行进行的。

(1)      对于第1

1

Tom

23

 

Age=23>20, 符合条件

 

(2)      对于第2

2

Jack

25

 

Age=25>20, 符合条件

 

(3)      对于第3

3

Lucy

15

 

Age=15<20, 不符合条件

 

(4)      对于第4

4

Anay

18

 

Age=18<20, 不符合条件

 

(5)      对于第5

5

Bobby

21

 

Age=21>20, 符合条件

 

由上述的(1)(2)(5)可知,最终符合条件的记录为下表2

 

ID

Name

Age

1

Tom

23

2

Jack

25

5

Bobby

21

                 2

 

4.      计算所有的表达式,即Select name部分,针对表2中的数据,最终符合条件的是3行,分别从每一行挑选出需要的字段值name,最终的结果如下表3

Name

Tom

Jack

Bobby

                                  3

 

下面举一般比较复杂的例子,有3个表 teacher 表,student表,tea_stu关系表:


teacher
teaID nameage
student
stuID nameage
teacher_student
teaID stuID


要求用一条sql查询出这样的结果
1.
显示的字段要有老师name, 每个老师所带的学生人数
2
只列出老师age45以下,学生age12以上的记录

 

先准备测试数据:

 

drop table if exists tea_stu;

droptable if exists teacher;

droptable if exists student;

     create table teacher(teaID int primary key,name varchar(50),age int);

     create table student(stuID int primary key,name varchar(50),age int);

     create table tea_stu(teaID int references teacher(teaID),stuID intreferences student(stuID));

insert into teacher values(1,' Tom',46), (2,'Jack',35) , (3,' Tony',36) , (4,' Lucy',37);

insert into student values(1,' Lili',11),(2,' Anay',15) , (3, 'Bobby',16) , (4, 'Jeff',17);

insert into tea_stu values(1,1), (1,2),(1,3),(2,2), (2,3), (2,4),(3,3), (3,4), (3,1),(4,4), (4,1), (4,2) , (4,3);

 

题目要求是列出 老师所带的学生数,条件是老师age45以下,学生age12以上,最理想的情况是有下面的一个表,如图1


                                  1

 

如果能构造一个图1的表,那么实现题目要求的SQL语句用下面的简单SQL查询就行:

 

select teacher.name, count(student.name)

from table

where teacher.age<45

   andstudent.age>12

group by teacher.name;

 

数据库中学生的信息和老师的信息是分别存放在student, teacher表中的,信息的关联只能依靠tea_stu,那么怎么构造图1的表呢?这时候可以用到表的关联,把这三个表的数据关联起来,注意:只要是表的关联就会产生笛卡尔积,所以务必把笛卡尔积去掉。关联表的最小粒度关联可以去掉笛卡尔积,具体的查询语句为:

select teacher.name,teacher.age,student.name,student.age

from teacher,student,tea_stu

where teacher.teaID=tea_stu.teaID

   andstudent.stuID=tea_stu.stuID

 

     所以综合以上所述,就能得出最终的查询语句

 

selectteacher.name, count(student.name) student_num

fromteacher,student,tea_stu

whereteacher.teaID=tea_stu.teaID

   and student.stuID=tea_stu.stuID

   and teacher.age<45

   and student.age>12

group byteacher.name;

 

结果如图2所示:

 

                      2

 

 

 

 

原创粉丝点击