SQL Server的GROUP BY和HAVING子句

muri 发表于 2016-11-5 09:10:18

　　在介绍GROUP BY 和 HAVING 子句前，我们必需先讲讲sql语言中一种特殊的函数：聚合函数，例如SUM, COUNT, MAX, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。

SELECT SUM(population) FROM bbc

　　这里的SUM作用在所有返回记录的population字段上，结果就是该查询只返回一个结果，即所有国家的总人口数。

　　通过使用GROUP BY 子句，可以让SUM 和 COUNT 这些函数对属于一组的数据起作用。当你指定 GROUP BY region 时，属于同一个region（地区）的一组数据将只能返回一行值，也就是说，表中所有除region（地区）外的字段，只能通过 SUM, COUNT等聚合函数运算后返回一个值。

　　HAVING子句可以让我们筛选成组后的各组数据，WHERE子句在聚合前先筛选记录．也就是说作用在GROUP BY 子句和HAVING子句前．而 HAVING子句在聚合后对组记录进行筛选。

　　让我们还是通过具体的实例来理解GROUP BY 和 HAVING 子句，还采用第三节介绍的bbc表。

　　SQL实例：

　　一、显示每个地区的总人口数和总面积：

SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region

　　先以region把返回记录分成多个组，这就是GROUP BY的字面含义。分完组后，然后用聚合函数对每组中的不同字段（一或多条记录）作运算。

　　二、显示每个地区的总人口数和总面积．仅显示那些面积超过1000000的地区。

SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(area)>1000000

　　在这里，我们不能用where来筛选超过1000000的地区，因为表中不存在这样一条记录。

　　相反，HAVING子句可以让我们筛选成组后的各组数据．

　　假设表的字段为depart_id, depart_name, employeename，查询具有depart_id的记录数大于2的所有记录的depart_id,和总数，正确的语句应为：
select depart_id, count(*)
from depart
group by departId
having count(*)>=2

      注意：先分组在算count

      下面还有2个例子：

      例１：查询出现过2次的user。
　　往往初学者会错误地认为在where 语句里直接使用count()算法，很显然这个想法是错误的，count()方法并不能被用在where子句中，为了解决问题，我们可以在group by子句后面使用HAVING来做条件限制。
　　错误做法：select * from user_num where count(user)>＝2 group by user;
　　正确做法：select * from user_num group by user HAVING count(user)>＝2 ;
　　解释说明：HAVING 与 WHERE 类似，可用来决定选择哪些记录。HAVING 子句在SELECT语句中指定，显示哪些已用 GROUP BY 子句分组的记录。在GROUP BY组合了记录后， HAVING会显示 GROUP BY 子句分组的任何符合 HAVING 子句的记录。
      例２：查询单一用户的num总和大于10的用户。
　　有前面的经验，把sum()方法写在HAVING子句中。
　　正确做法：select * from user_num group by user HAVING sum(num)>10 ;
　　注意：一个HAVING子句最多只能包含40个表达式，HAVING子句的表达式之间可以用AND和OR分割。
　　如果count后面是(*)，就是任意一个或多个字段有重复记录时候，他就count。
　　若指定字段，则当指定字段有重复的时候数。如果多条记录（不是相同，即两组不同的记录重复），则返回的记录集合是总共的。
　　

页: [1]

运维网's Archiver

SQL Server的GROUP BY和HAVING子句