子查询语法很简单,就是select 语句的嵌套使用。
查询工资比SCOTT高的员工信息
分析:两步即可完成
1. 查出SCOTT的工资 SQL> select ename, sal from emp where ename='SCOTT'???其工资3000
2. 查询比3000高的员工 SQL> select * from emp where sal>3000??
通过两步可以将问题结果得到。子查询,可以将两步合成一步。
——子查询解决的问题:问题本身不能一步求解的情况。
SQL> select *
??from emp ?
??where sal ?> ?(select sal ?
?from emp ?
?where ename='SCOTT') ?
子查询语法格式:
SELECT select_list
FROM table
WHERE expr operator
? (SELECT select_list
?????FROM table);
本章学习目标:?
描述子查询可以解决的问题
定义子查询(子查询的语法)
列出子查询的类型。
书写单行子查询和多行子查询。
1. 合理的书写风格?(如上例,当写一个较复杂的子查询的时候,要合理的添加换行、缩进)
2. 小括号( )?
3. 主查询和子查询可以是不同表,只要子查询返回的结果主查询可以使用即可
4. 可以在主查询的where、select、having、from后都可以放置子查询
5. 不可以在主查询的group by后面放置子查询?(SQL语句的语法规范)
6. 强调:在from后面放置的子查询(***) from后面放置是一个集合(表、查询结果)
7. 一般先执行子查询(内查询),再执行主查询(外查询);但是相关子查询除外 ?
8. 一般不在子查询中使用order by, 但在Top-N分析问题中,必须使用order by??
9. 单行子查询只能使用单行操作符;多行子查询只能使用多行操作符
10. 子查询中的null值
查询部门名称是“SALES”的员工信息
主查询:查询员工信息。select * from emp;
子查询:负责得到部门名称(在dept表中)、部门号对应关系。select deptno from dept where dname='SALES' ???
SQL> select *
?from emp ?
? ?where deptno= (select deptno ?
from dept
where dname='SALES') ???
主查询,查询的是员工表emp,子查询,查询的是部门表dept。是两张不同的表。
将该问题使用“多表查询”解决:
SQL> select e.* ?from emp e, dept d ?where e.deptno=d.deptno and d.dname='SALES' ???
两种方式哪种好呢?
※SQL优化: 理论上,既可以使用子查询,也可以使用多表查询,尽量使用“多表查询”。子查询有2次from
不同数据库处理数据的方式不尽相同,如Oracle数据库中,子查询地位比较重要,做了深入的优化。有可能实际看到结果是子查询快于多表查询。
子查询可以放在select后,但,要求该子查询必须是 单行子查询:(该子查询本身只返回一条记录,2+叫多行子查询)
SQL> select empno, ename, (select dname from dept where deptno=10) 部门 from emp???
注意:SQL中没有where是不可以的,那样是多行子查询。
进一步理解查询语句,实际上是在表或集合中通过列名来得到行数据,子查询如果是多行,select无法做到这一点。
在 having 后 和 where 类似。但需注意在where后面不能使用组函数。 ??????
表,代表一个数据集合、查询结果(SQL)语句本身也代表一个集合。
查询员工的姓名、薪水和年薪:
说明:该问题不用子查询也可以完成。但如果是一道填空题:select * from ___________________
因为显示的告诉了,要使用select *
SQL> select * from (select ename, sal, sal*12 年薪 from emp);
将select 语句放置到from后面,表示将select语句的结果,当成表来看待。这种查询方式在Oracle语句中使用比较频繁。
单行子查询就是该条子查询执行结束时,只返回一条记录(一行数据)。
使用单行操作符:
=、>、>=、<、<=、<>
如:
SELECT last_name, job_id, salary
FROM ??employees
WHERE ?job_id = ?
????????????????(SELECT job_id
?????????????????FROM ??employees
?????????????????WHERE ?employee_id = 141)
AND ???salary >
????????????????(SELECT salary
?????????????????FROM ??employees
?????????????????WHERE ?employee_id = 143);
再如:
SELECT last_name, job_id, salary
FROM ??employees
WHERE ?salary =
????????????????(SELECT MIN(salary)
?????????????????FROM ??employees);
也可以在having子句中使用:
SELECT ??department_id, MIN(salary)
FROM ????employees
GROUP BY department_id
HAVING ??MIN(salary) >
???????????????????????(SELECT MIN(salary)
????????????????????????FROM ??employees
????????????????????????WHERE ?department_id = 50);
上面的例子告诉我们:
1. 单行子查询,只能使用单行操作符(=号、>号)
2. 在一个主查询中可以有多个子查询。
3. 子查询里面可以嵌套多层子查询。
4. 子查询也可以使用组函数。子查询也是查询语句,适用于前面所有知识。
非法使用子查询的例子:
SELECT employee_id, last_name
FROM ??employees
WHERE ?salary =
????????????????(SELECT ??MIN(salary)
?????????????????FROM ????employees
?????????????????GROUP BY department_id);
在此例中,单行操作符“=”连接了返回多条记录的子查询。查询语句执行会报错。
子查询返回2条记录以上就叫多行。
多行操作符有:
IN 等于列表中的任意一个
ANY 和子查询返回的任意一个值比较
ALL 和子查询返回的所有值比较
IN(表示在集合中):
查询部门名称为SALES和ACCOUNTING的员工信息。
分析:部门名称在dept表中,员工信息在emp表中。→
??子查询应先去dept表中将SALES和ACCOUNTING的部门号得到,交给主查询得员工信息
SQL> select *
??from emp
??where deptno in (select deptno
??from dept
??where dname=?'SALES?'or dname=?'ACCOUNTING?'); ?
使用 多表查询 来解决该问题:
SQL> select e.*
??from emp e, dept d
??where ?e.deptno=d.deptno and (d.dname=?'SALES?' or d.dname=?'ACCOUNTING?');
这种解决方式,注意使用()来控制优先级。?
如果查询不是这两个部门的员工,只要把in → not?in就可以了,注意不能含有空值。
ANY(表示和集合中的任意一个值比较):
查询薪水比30号部门任意一个员工高的员工信息:
分析:首先查出30号部门的员工薪水的集合,然后 >?它就得到了该员工信息。
SQL> select * from emp where sal > (select sal from emp where deptno=30); ? 正确吗?
这样是错的,子句返回多行结果。而‘>’是单行操作符。 ——应该将‘>’替换成‘> any’
实际上>集合的任意一个值,就是大于集合的最小值。
若将这条语句改写成单行子查询应该怎么写呢?
SQL> select * from emp where sal > (select min(sal) from emp where deptno=30); ?
ALL(表示和集合中的所有值比较):
查询薪水比30号部门所有员工高的员工信息。
SQL> Select * from emp where sal > all (select sal from emp where deptno=30); ?
同样,将该题改写成单行子句查询:
SQL> Select * from emp where sal > (select max(sal) from emp where deptno=30); ?
对于any 和?all?来说,究竟取最大值还是取最小值,不一定。将上面的两个例子中的“高”换成“低”,any和all就各自取相反的值了。
判断一个值等于、不等于空,不能使用=和!=号,而应该使用is 和 not。
如果集合中有NULL值,不能使用not in。如: not in (10, 20, NULL),但是可以使用in。为什么呢?
先看一个例子:
查询不是老板的员工信息:
分析:不是老板就是树上的叶子节点。在emp表中有列mgr,该列表示该员工的老板的员工号是多少。那么,如果一个员工的员工号在这列中,那么说明这员工是老板,如果不在,说明他不是老板。
SQL> select * from emp where empno not in (select mgr from emp); ?但是运行没有结果,因为有NULL?
查询是老板的员工信息: 只需要将not去掉。
SQL> select * from emp where empno in (select mgr from emp ); ?
还是我们之前null的结论:in (10, 20, null)?可以,not in (10, 20, null)?不可以
例如:a not in(10, 20, NULL) 等价于 (a != 10) and (a != 20) and (a != NULL)
??因为,not?in操作符等价于 !=All,最后一个表达式为假,整体假。如:
SELECT emp.last_name
FROM ??employees emp
WHERE ?emp.employee_id NOT IN
?????????????????????????????(SELECT mgr.manager_id
??????????????????????????????FROM ?employees mgr);
??a in (10, 20, NULL) ??等价于 (a = 10) or (a = 20) or (a = null)只要有一个为真即为真。
??in 操作符等价于?=?Any
所以子查询中,如果有NULL值,主查询使用where xxx=子查询结果集。永远为假。
继续,查询不是老板的员工信息。 只要将空值去掉即可。
SQL> ?select * from emp where empno not in (select mgr from emp where mgr is not null); ?
一般情况下,子查询使用order?by或是不使用order by对主查询来说没有什么意义。子查询的结果给主查询当成集合来使用,所以没有必要将子查询order by。
但,在Top-N分析问题中,必须使用order by
含有子查询的SQL语句执行的顺序是,先子后主。
但,相关子查询例外
查询部门号是10和20的员工信息: ?思考有几种方式解决该问题??
Select *?from emp where deptno=10 加上
Select *?from emp where deptno=20
集合运算所操作的对象是两个或者多个集合,而不再是表中的列(select一直在操作表中的列)
集合运算的操作符。A∩B、A∪?B、A?-?B
QL> ? select * from emp where deptno=10
union
??? select * from emp where deptno=20 注意:这是一条SQL语句。
问题:按照部门统计各部门不同工种的工资情况,要求按如下格式输出:
?
分析SQL执行结果。 ?
第一部分数据是按照deptno和job进行分组;select 查询deptno、job、sum(sal)
第二部分数据是直接按照deptno分组即可,与job无关;select?只需要查询deptno,sum(sal)
第三部分数据不按照任何条件分组,即group?by null;select 查询sum(sal)
所以,整体查询结果应该= ?group by deptno,job ?+ ?group by deptno ?+ ?group by null
按照集合的要求,必须列数相同,类型一致,所以写法如下,使用null强行占位!
SQL> select deptno,job,sum(sal) from emp group by deptno,job
?union
?select deptno,to_char(null),sum(sal) from emp group by deptno
?union
?select to_number(null),to_char(null),sum(sal) from emp;
需要注意:集合运算的性能一般较差.
SQL的执行时间:
set timing on/off 默认是off
交集和差集与并集类似,也要注意以上三点。只不过算法不同而已。
?