GROUP BY 语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。
1)案例实操:
(1)计算 emp 表每个部门的平均工资
hive (default)> select deptno,avg(sal) from emp group by deptno;
(2)计算 emp 每个部门中平均薪资大于2000,及部门平均薪资。
hive (default)> select deptno,avg(sal) avg_sal from emp group by deptno having avg_sal > 1500;
#另一种低效的写法
hive (default)> select deptno,avg_sal from(select deptno,avg(sal) avg_sal from emp group by deptno) t1 where avg_sal>1500;
(3)计算 emp 每个部门中每个岗位的最高薪水
select t.deptno, t.job, max(t.sal) max_sal from emp t group by t.deptno, t.job;
1)having 与 where 不同点
(1)where 后面不能写分组函数,而 having 后面可以使用分组函数。
(2)having 只用于 group by 分组统计语句。
2)案例实操
(1)求每个部门的平均薪水大于2000 的部门
hive (default)> select deptno, avg(sal) avg_sal from emp group by deptno ?having avg_sal > 2000;