SQL-SELECT-检索数据(二)

来源:互联网 发布:右友是一款什么软件 编辑:程序博客网 时间:2024/06/06 15:38

6. 创建计算字段

什么是计算字段?

如何创建计算字段?

如何从应用层序中使用别名引用它们?


① 拼接字段

计算字段并不实际存在于数据库表中。计算字段是运行时在SELECT语句内创建的。

字段(field)
基本上与列(column)的意思相同,经常互换使用,不过数据库列一般称为列,而术语字段通常与计算字段一起使用。

拼接 (concatenate)
将值联结到一起(将一个值附加到另一个值)构成单个值。

在SQL中的SELECT语句中,可以使用一个特殊的操作符来拼接两个列。根据你所使用的DBMS,此操作符可以用加号(+)或两个竖杠(||)表示。在MySQL和MariaDB中,必须使用特使的函数。

SELECT vend_name + '(' + vend_county + ')'FROM VendorsORDER BY vend_name;

去掉计算字段中的空格,用SQL的 RTRIM( ) 函数来完成。

SELECT RTRIM(vend_name) + '(' + RTIRM(vend_country) + ')'FROM VendorsORDER BY vend_name;

RTRIM( )函数去掉右边的所有空格。通过使用RTRIM( ),各个列都进行了整理。

大多数DBMS都支持 :
RTRIM( ) 去掉字符串右边的空格
LTRIM( ) 去掉字符串左边的空格
TRIM( ) 去掉字符串左右两边的空格


使用别名

别名有时也称导出列(derived column),以便应用程序能引用计算字段。

从前面的输出可以看出,SELECT语句可以很好地拼接地址字段。但是,这个新计算列的名字是什么呢?实际上它没有名字,它只是一个值。如果仅在SQL查询工具中查看一下结果,这样没有什么不好。但是,一个未命名的列不能用于客户端应用中,因为客户端没有办法引用它。

为了解决这个问题,SQL支持列别名。别名(alias)是一个字段或值的替换名。别名用AS关键字赋予。

-- 包含指定计算结果的名为vend_title的计算字段,任何客户端都可以按名称应用这个列,就像它是一个实际的列表一样。SELECT RTRIM(vend_name) + '(' + RTRIM(vend_country)+ ')' AS vend_titleFROM vendorsORDER BY vend_name;

在MySQL和MariaDB中使用的语句:

SELECT concat(vend_name, '(', vend_country, ')')       AS vend_titleFROM vendorsORDER BY vend_name;

别名的其他用途:常见的用途包括在实际的列表名包含不合法的字符(如空格)时重新命名它,在原来的名字含混或者容易误解时扩充它。


② 执行算术计算

计算字段的另一个常见的用途是对检索出的数据进行算术计算。

-- 计算字段:对检索出的数据进行算术计算SELECT prod_id, quantity, item_priceFROM orderitemsWHERE order_num = 20008;SELECT prod_id,       quantity,       item_price,       quantity*item_price AS expanded_priceFROM orderitemsWHERE order_num = 20008;

7. 使用数据处理函数

什么是函数?

DBMS支持何种函数?

如何使用这些函数?

为什么SQL函数的使用可能会带来问题?


函数一般是在数据上执行的,为数据的转换和处理提供了方便。

与几乎所有DBMS都等同支持SQL语言不同,每一个DBMS都有特定的函数。事实上,只要少数几个函数被所有主要的DBMS等同的支持。虽然所有类型的函数一般都可以在每一个DBMS中使用,但是各个函数的名称和语法可能极其不同。

① 文本处理函数

RTRIM()函数用于去除列值右边的空格。
UPPER()函数用于将文本转换为大写。

SELECT vend_name, UPPER(vend_name) AS vend_name_upcaseFROM vendorsORDER BY vend_name;

常用文本处理函数:

这里写图片描述

注:SOUNDEX( ) 是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。

使用SOUNDEX()函数进行搜索,它匹配所有发音类似于Michael Green的联系名:

SELECT cust_name, cust_contactFROM customersWHERE SOUNDEX(cust_contact) = SOUNDEX('Michael Green');

WHERE子句使用SOUNDEX()函数把cust_contact列值和搜索字符串转换为它们的SOUNDEX值。因为Michael Green和Michelle Green发音相似,所以它们的SOUNDEX值匹配,因此WHERE子句正确地过滤出了所需的数据。

② 数值处理函数

在主要DBMS的函数中,数值函数是最一致、最统一的函数。

常用数值处理函数:

这里写图片描述
这里写图片描述

虽然这些函数在格式化、处理和过滤数据中非常有用,但它们在各种SQL实现中很不一致。


8. 汇总数据

什么是SQL的聚集函数?

如何利用它们汇总表的数据?


SQL 的聚集函数在各种主要SQL实现中得到了相当一致的支持。

聚集函数(aggregate function)对某些行运行的函数,计算并返回一个值。

SQL聚集函数:
这里写图片描述

① AVG() 函数

通过对表中行数计数并计算其列值之和,求得该列的平均值。AVG() 可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。

AVG()函数忽略列值为NULL的行。

-- products表中所有产品的平均价格SELECT AVG(prod_price) AS avg_priceFROM products;-- 返回特定供应商所提供产品的平均价格SELECT AVG(prod_price) AS avg_priceFROM productsWHERE vend_id = 'DLL01';

② COUNT() 函数

计数。确定表中行的数目或符合特定条件的行的数目。

COUNT()函数有两种使用方式:

  1. 使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。
  2. 使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。

如果指定列名,则COUNT()函数会忽略指定列的值为空的行,但如果COUNT()函数中用的是星号(*),则不忽略。

-- 返回customers表中顾客的总数:SELECT COUNT(*) AS num_custFROM custormers;-- ---------- num_cust-- ---------- 5-- ---------- 只对具有电子邮件地址的客户计数SELECT COUNT(cust_email) AS num_custFROM custormers;-- ---------- num_cust-- ---------- 3-- ---------- 5个顾客中只有3个顾客有电子邮箱地址

③ MAX() 函数

MAX() 返回指定列中的最大值。MAX() 要求指定列名。

MAX()函数忽略列值为NULL的行。在用于文本数据时,MAX()返回按该列排序后的最后一行。

-- MAX()返回表中最贵物品的价格SELECT MAX(prod_price) AS max_priceFROM products;

④ MIN() 函数

MIN() 返回指定列的最小值。MIN() 要求指定列名。

MIN()函数忽略列值为NULL的行。在用于文本数据时,MIN()返回该列排序后最前面的行。

-- MIN()返回表中最便宜物品的价格SELECT MIN(prod_price) AS min_priceFROM products;

⑤ SUM() 函数

SUM() 用来返回指定列值的和(总计)。

SUM() 函数忽略列值为NULL的行。

-- 检索所订购物品的总数(所有quantity值之和)SELECT SUM(quantity) AS items_orderedFROM orderItemsWHERE order_num = 20005;-- 某个物品的总订单金额SELECT SUM(item_price*quantity) AS total_priceFROM orderItemsWHERE order_num = 20005;

利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。

聚集不同值

  1. 对所有行执行操作,指定ALL参数或者不指定参数(因为ALL是默认行为)。
  2. 只包含不同的值,指定DISTINCT参数。
-- 使用了DISTINCT后,此例子中的avg_price比较高,因为有多个物品具有相同的较低价格。排除它们提升了平均价格SELECT AVG(DISTINCT prod_price) AS avg_priceFROM productsWHERE vend_id = 'DLL01';

如果指定列名,则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*)。类似地,DISTINCT必须使用列名,不能用于计算或表达式。

组合聚合函数

SELECT 语句可根据需要包含多个聚合函数。

-- 单条SELECT语句执行了4个聚集计算,返回4个值SELECT COUNT(*) AS num_items,       MIN(prod_price) AS price_min,       MAX(prod_price) AS price_max,       AVG(prod_price) AS price_avgFROM products;-- ------------------------------------------------------------------ num_items      price_min           price_max p         rice_avg-- ----------     ---------------     ---------------     ----------- 9              3.4900              11.9900             6.823333-- ----------------------------------------------------------------

聚集函数用来汇总数据。SQL支持5个聚集函数,可以用多种方法使用它们,返回所需的结果。这些函数很高效,它们返回结果一般比你在自己的客户端应用程序中计算要快得多。


9. 分组数据

如何分组数据,以便汇总表内容的子集?


利用GROUP BY子句 和 HAVING 子句

① 创建分组

GROUP BY子句

-- 返回供应商DLL01提供的产品数目:SELECT COUNT(*) AS num_prods FROM products WHERE vend_id = 'DLL01';-- 返回每个供应商提供的产品数目SELECT vend_id, COUNT(*) AS num_prods FROM products GROUP BY vend_id;-- 因为使用了GROUP BY,就不必指定要计算和估计的每个组了。系统会自动完成。GROUP BY子句指示DBMS分组数据,然后对每个组而不是整个结果进行聚集。

注意:
1. GROUP BY子句必须出现在WHERE子句之后, ORDER BY 子句之前。
2. 如果分组列中包含具有NULL值的行,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。
3. 除了聚集计算语句外,SELECT语句中的每一列都必须在GROUP BY子句中给出。

② 过滤分组

HAVING 子句

WHERE过滤行,而HAVING过滤分组。HAVING支持所有WHERE操作符(包括通配符条件和带多个操作符的子句)。

-- 列出至少有两个订单的所有客户SELECT cust_id, COUNT(*) AS num_ordersFROM OrdersGROUP BY cust_idHAVING COUNT(*) >= 2;

HAVING和WHERE的差别:WHERE在数据分组前进行过滤,HAVING在分组后进行过滤。这是一个重要的区别,WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。

-- 列出具有两个以上 产品且其大于等于4 的供应商SELECT vend_id, COUNT(*) AS num_vendFROM productsWHERE prod_price >= 4GROUP BY vend_idHAVING COUNT(*) >= 2-- ------------------------- vend_id     num_prods-- -------     ------------- BRS01       3-- FNG01       2-- ------------------------- 若没有WHERE, 则会多检索一行(供应商DLL01,销售4个产品,价格都在4 以下)SELECT vend_id, COUNT(*) AS num_vendFROM productsGROUP BY vend_idHAVING COUNT(*) >= 2-- ------------------------- vend_id     num_prods-- -------     ------------- BRS01       3-- DLL01       4-- FNG01       2-- -----------------------

使用HAVING时应该结合GROUP BY子句,而WHERE子句用于标准的行级过滤。

③ 分组和排序

GROUP BY 和 ORDER BY 经常完成相同的工作,但它们非常不同。差别如下表:

这里写图片描述

一般在使用GROUP BY 子句时,应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。

-- 检索包含三个或更多物品的订单和订购物品数目SELECT order_num, COUNT(*) AS numFROM OrderItemsGROUP BY order_numHAVING COUNT(*) >= 3;

这里写图片描述

-- 检索包含三个或更多物品的订单和订购物品数目 使用ORDER BYSELECT order_num, COUNT(*) AS numFROM OrderItemsGROUP BY order_numHAVING COUNT(*) >= 3ORDER BY num, order_num;

这里写图片描述


SELECT 子句顺序

这里写图片描述


10. 使用子查询

什么是子查询?

如何使用它们?


子查询(subquery):嵌套在其他查询中的查询。

子查询常用于WHERE子句的IN操作符中,以及用来填充计算列。

① 利用子查询进行过滤

在SELECT语句中,子查询总是由内向外处理。

列出订购物品RGAN01的所有顾客。
1. 检索出包含物品RGAN01的所有订单的编号。
2. 检索具有前一步骤列出的订单编号的所有顾客的ID。
3. 检索前一步骤返回的所有顾客ID的顾客信息。

SELECT order_num FROM OrderItemsWHERE prod_id = 'RGAN01';SELECT cust_idFROM  OrdersWHERE order_num IN ('20007','20008');SELECT cust_name, cust_contactFROM  CustomersWHERE cust_id IN ('1000000004','1000000005');--利用子查询SELECT cust_name, cust_contactFROM  CustomersWHERE cust_id IN (SELECT cust_id                  FROM  Orders                  WHERE order_num IN (SELECT order_num                                       FROM OrderItems                                      WHERE prod_id = 'RGAN01'));

这里写图片描述

注:
1. 作为子查询的SELECT语句只能查询单个列。企图检索多个列将返回错误。
2. 使用子查询并不是执行这类数据检索最有效的方法。可以使用联结。

② 作为计算字段使用子查询

需要显示Customers表中每个顾客的订单总数。订单与相应的顾客ID存储在Orders表中。
1. 从Customers表中检索顾客列表。
2. 对于检索出的每个顾客,统计其在Orders表中的订单数目。

SELECT COUNT(*) AS ordersFROM OrdersWHERE  cust_id  = '1000000001';-- 使用子查询SELECT cust_name, cust_address, (SELECT COUNT(*) AS orders                                FROM Orders                                WHERE  orders.cust_id  = Customers.cust_id) AS ordersFROM CustomersORDER BY cust_name

这里写图片描述

完全限定列名:如果在SELECT语句中操作多个表,就应使用完全限定列名来避免奇异。

不止一种解决方案:可以使用JOIN来解决这样的问题。

0 0
原创粉丝点击