子查询指一个查询语句嵌套在另一个查询语句内部的查询,这个特性从MySQL 4.1开始引入。
SQL 中子查询的使用大大增强了 SELECT 查询的能力,因为很多时候查询需要从结果集中获取数据,或者需要从同一个表中先计算得出一个数据结果,然后与这个数据结果(可能是某个标量,也可能是某个集合)进行比较。
1. 需求分析与问题解决
1.1 实际问题
现有的解决方式:
-- 需求:谁的工资比Abel高
-- 方式1:两次查询
# 由具体的需求引入子查询
SELECT
employee_id,
last_name,
salary
FROM
employees
WHERE
last_name = 'Abel';
SELECT
employee_id,
last_name,
salary
FROM
employees
WHERE
salary > 11000;
-- 方式2:自连接
SELECT
e1.employee_id,
e1.last_name,
e1.salary
FROM
employees e1,
employees e2
WHERE
e2.last_name = 'Abel'
AND e1.salary > e2.salary;
-- 方式3:子查询
SELECT
last_name,
salary
FROM
employees
WHERE
salary > ( SELECT salary FROM employees WHERE last_name = 'Abel' );
-- 2. 称谓的规范:外查询(主插叙)和内查询(子查询)
1.2 子查询的基本使用
子查询的基本语法结构
SELECT select_list
FROM `table`
WHERE expr operator
(
SELECT select_list,
FROM `table`
);
子查询(内查询)在主查询之前一次完成
- 子查询的结果被主查询(外查询)使用
- 注意事项
- 子查询需要被括号包起来
- 一般将子查询放在比较条件的右侧
- 单行操作符对应单行子查询,多行操作符对应多行子查询
1.3 子查询的分类
分类方式1:
按照子查询返回的是一行还是多行结果,分为单行子查询
和多行子查询
- 单行子查询
- 多行子查询
分类方式2:
按照子查询是否被执行多次,分为相关(关联)子查询
和不相关(非关联)子查询
子查询从数据表中查询了数据结果,如果这个数据结果只执行一次,然后这个数据结果作为主查询的条件进行执行,那么这样的子查询叫做不相关子查询
。
同样,如果子查询需要执行多次,即采用循环的方式,先从外部查询开始,每次都传入子查询进行查询,然后再将结果反馈给外部,这种嵌套的执行方式就称为相关子查询
。
相关子查询的需求:查询工资大于本部门平均工资的员工的信息 不相关子查询的需求:查询工资大于本公司平均公司的员工的信息
2. 单行子查询
2.1 单行操作符
操作符 | 含义 |
---|---|
= | equal to |
> | greater than |
>= | greater than or equal to |
< | less than |
<= | less than or equal to |
<> | not equal to |
2.2 代码示例
题目:查询工资大于149号员工工资的员工信息
-- 题目:查询工资大于149号员工工资的员工信息
SELECT
employee_id,
last_name,
salary
FROM
employees
WHERE
salary > ( SELECT salary FROM employees WHERE employee_id = 149 );
题目:返回
job_id
和141号员工相同,salary
比143号员工多的员工姓名,job_id
和工资
/* 题目:返回job_id和141号员工相同,salary比143号员工多的员工姓名,job_id和工资*/
SELECT
last_name,
job_id,
salary
FROM
employees
WHERE
job_id = ( SELECT job_id FROM employees WHERE employee_id = 141 )
AND salary > ( SELECT salary FROM employees WHERE employee_id = 143 );
题目:返回公司工资最少的员工的
last_name
,job_id
和salary
SELECT
last_name,
job_id,
salary
FROM
employees
WHERE
salary = ( SELECT MIN(salary) FROM employees );
题目:查询与141号或174号员工的
manager_id
和department_id
相同的其他员工的employee_id
,manager_id
,department_id
注意:需要排除141号和174号两名员工本身
-- 方法1:不成对比较
SELECT
employee_id,
manager_id,
department_id
FROM
employees
WHERE
manager_id IN ( SELECT manager_id FROM employees WHERE employee_id IN ( 141, 174 ) )
AND department_id IN ( SELECT department_id FROM employees WHERE employee_id IN ( 141, 174 ) )
AND employee_id NOT IN ( 141, 174 );
-- 方法2:成对比较
SELECT
employee_id,
manager_id,
department_id
FROM
employees
-- 直接两个字段一起比较
WHERE
( manager_id, department_id ) IN ( SELECT manager_id, department_id FROM employees WHERE employee_id IN ( 141, 174 ) )
AND employee_id NOT IN ( 141, 174 );
2.3 HAVING中的子查询
- 首先执行子查询
- 再向主查询中的HAVING语句返回结果
问题:查询最低工资大于50号部门最低工资的部门id和其最低工资
-- 问题:查询最低工资大于50号部门最低工资的部门id和其最低工资
SELECT
e1.department_id,
department_name,
MIN(e1.salary)
FROM
employees e1
LEFT JOIN departments d ON e1.department_id = d.department_id
GROUP BY
e1.department_id
HAVING MIN(e1.salary) > ( SELECT MIN(e2.salary) FROM employees e2 WHERE e2.department_id = 50 );
2.4 CASE中的子查询
在CASE表达式中使用单列子查询:
题目:显式员工的
employee_id
,last_name
和location
。其中,若员工department_id
与location_id
为1800的department_id
相同,则location
为Canada
,其余则为USA
SELECT
employee_id,
last_name,
CASE
department_id
WHEN ( SELECT department_id FROM departments WHERE location_id = 1800 ) THEN
'Canada' ELSE 'USA'
END "location"
FROM
employees;
2.5 子查询中的空值问题
可能子查询中查到的数据是不存在的,那么就会涉及到空值
的问题。这种情况下,子查询不会返回任何数据
不会报错,但是结果集中也不会有任何的数据
2.6 非法使用子查询
多行子查询必须使用多行比较符,如果使用了单行比较符,就会出现非法使用子查询的问题
SELECT employee_id, last_name
FROM employees
WHERE salary =
(SELECT MIN(salary)
FROM employees
GROUP BY department_id);
3. 多行子查询
- 也称为集合比较子查询
- 内查询返回多行
- 使用多行比较符
3.1 多行比较操作符
| 操作符 | 含义 | | —- | —- | | IN | 等于列表中的任意一个 | | ANY | 需要和单行比较操作符一起使用,和子查询返回的某一个值比较 | | ALL | 需要和单行比较操作符一起使用,和子查询返回的所有值比较 | | SOME | 实际上是ANY的别名,作用相同,一般常使用ANY |
3.2 代码示例
操作符:IN
-- IN
SELECT employee_id, last_name
FROM employees
WHERE salary IN
(SELECT MIN(salary)
FROM employees
GROUP BY department_id);
操作符:ANY/ALL
题目:返回其它
job_id
中比job_id
为IT_PROG
部门任一工资低的员工的员工号、姓名job_id
以及salary
-- 题目:返回其它job_id中比job_id为‘IT_PROG’部门所有工资都低的员工的员工号、姓名、job_id以及salary
SELECT
employee_id,
last_name,
job_id,
salary
FROM
employees
WHERE
job_id <> 'IT_PROG'
AND salary < ANY ( SELECT salary FROM employees WHERE job_id = 'IT_PROG' );
题目:返回其它
job_id
中比job_id
为IT_PROG
部门所有工资都低的员工的员工号、姓名、job_id
以及salary
/*
题目:返回其它job_id中比job_id为IT_PROG部门所有工资都低的员工的员工号、姓名、job_id以及salary
*/
SELECT
employee_id,
last_name,
job_id,
salary
FROM
employees
WHERE
job_id <> 'IT_PROG'
AND salary < ALL ( SELECT salary FROM employees WHERE job_id = 'IT_PROG' );
题目:查询平均工资最低的部门
department_id
/*
查询平均工资最低的部门的部门id
*/
SELECT
department_id,
AVG(salary)
FROM
employees
GROUP BY
department_id
HAVING
AVG(salary) <= ALL ( SELECT AVG(salary) FROM employees GROUP BY department_id );
可以将子查询的结果集当作一张虚拟的数据表来使用
-- 将子查询的结果当作一张表来使用
/*
查询平均工资最低的部门的部门id
*/
SELECT
MIN(`avg_salary`)
FROM
( SELECT AVG(salary) `avg_salary` FROM employees GROUP BY department_id ) `t_avg_salary`;
3.3 空值问题
SELECT last_name
FROM employees
WHERE employee_id NOT IN (
SELECT manager_id
FROM employees
);
4. 相关子查询
4.1 相关子查询的查询流程
如果子查询的执行依赖于外部查询,通常情况下都是因为子查询中的表用到了外部的表,并进行了条件关联,因此每执行一次外部查询,子查询都要重新计算一次,这样的子查询就称之为关联子查询
。
相关子查询按照一行接一行的顺序执行,主查询的每一行都执行一次子查询。
说明:子查询中使用主查询中的列(子查询用到的数据和主查询是有关联的)
4.2 代码示例
回顾:查询员工中工资大于本公司平均工资的员工的
last_name
,salary
和department_id
-- 回顾:查询员工中工资大于本公司平均工资的员工的last_name,salary和其department_id
SELECT
last_name,
salary,
department_id
FROM
employees
WHERE
salary > ( SELECT AVG(salary) FROM employees );
题目:查询员工中工资大于本部门平均工资的员工的
last_name
,salary
和其department_id
方法一:使用相关子查询
-- 题目:查询员工中工资大于本部门平均工资的员工的last_name,salary和其department_id
SELECT
e1.last_name,
e1.salary,
e1.department_id
FROM
employees e1
WHERE
e1.salary > ( SELECT AVG(e2.salary) FROM employees e2 WHERE e1.department_id = e2.department_id );
方法二:在FROM中使用子查询
-- 方法2:在FROM中使用子查询
SELECT
e1.last_name,
e1.salary,
e1.department_id
FROM
employees e1,( SELECT department_id,AVG(salary) `avg_salary` FROM employees GROUP BY department_id ) e2
WHERE
e1.department_id = e2.department_id
AND e1.salary > e2.`avg_salary`;
from型的子查询:子查询是作为from的一部分,子查询要用()引起来,并且要给这个子查询取别名,把它当成一张“临时的虚拟的表”来使用。
题目:查询员工的
id
,salary
,按照department_name
排序
-- 题目:查询员工的id,salary,按照department_name 排序
SELECT
e.employee_id,
e.department_id,
e.salary
FROM
employees e
ORDER BY ( SELECT department_name FROM departments d WHERE e.department_id = d.department_id );
可以使用子查询的位置:在SELECT
中,除了GROUP BY
和 LIMIT
之外,其他的位置都是可以声明子查询的
题目:若
employees
表中employee_id
与job_history
表中employee_id
相同的数目不小于2,输出这些相同id的员工的employee_id
,last_name
和其job_id
/*
题目:若employees表中employee_id与job_history表中employee_id相同的数目不小于2,输出这些相同id的员工的employee_id,last_name和其job_id
*/
SELECT
e1.employee_id,
e1.last_name,
e1.job_id
FROM
employees e1
WHERE
2 <= ( SELECT COUNT(*) FROM job_history j WHERE j.employee_id = e1.employee_id );
4.3 EXISTS和NOT EXISTS
- 关联子查询通常也会与
EXISTS
操作符一起来使用,用来检查在子查询中是否存在满足条件的行 - 如果在子查询中不存在满足条件的行
- 条件返回
FALSE
- 继续在子查询中进行查找
- 条件返回
- 如果在子查询中存在满足条件的行
- 退出子查询
- 条件返回
TRUE
NOT EXISTS
关键字表示如果不存在某种条件,就返回TRUE
,否则返回FALSE
题目:查询公司管理者的employee_id,last_name,job_id,department_id信息
方法1:自连接
-- 方法1:自连接
SELECT
DISTINCT
mgr.employee_id,
mgr.last_name,
mgr.job_id,
mgr.department_id
FROM
employees e
JOIN employees mgr ON e.manager_id = mgr.employee_id;
方法2:子查询
先查出所有管理者的
id
SELECT
e.employee_id,
e.last_name,
e.job_id,
e.department_id
FROM
employees e
WHERE
e.employee_id IN ( SELECT DISTINCT e1.manager_id FROM employees e1 WHERE e1.manager_id );
方法3:EXISTS
SELECT
e2.employee_id,
e2.last_name,
e2.job_id,
e2.department_id
FROM
employees e2
WHERE EXISTS ( SELECT * FROM employees e1 WHERE e2.employee_id = e1.manager_id );
题目:查询
departments
表中,不存在于employees
表中的部门的department_id
和department_name
方法1:右连接
SELECT
d.department_id,
d.department_name
FROM
employees e
RIGHT JOIN departments d ON e.department_id = d.department_id
WHERE
e.department_id IS NULL;
方法2:NOT EXISTS
-- 方法2:NOT EXISTS
SELECT
d1.department_id,
d1.department_name
FROM
departments d1
WHERE NOT EXISTS ( SELECT * FROM employees e WHERE e.department_id = d1.department_id );
4.4 相关更新
UPDATE table1 alias1
SET column = (SELECT expression
FROM table2 alias2
WHERE alias1.column = alias2.column);
使用相关子查询依据一个表中的数据更新另一个表的数据。
题目:在employees中增加一个department_name字段,数据为员工对应的部门名称
# 1)
ALTER TABLE employees
ADD(department_name VARCHAR2(14));
# 2)
UPDATE employees e
SET department_name = (SELECT department_name
FROM departments d
WHERE e.department_id = d.department_id);
4.5 相关删除
DELETE FROM table1 alias1
WHERE column operator (SELECT expression
FROM table2 alias2
WHERE alias1.column = alias2.column);
使用相关子查询依据一个表中的数据删除另一个表的数据。
题目:删除表employees中,其与emp_history表皆有的数据
DELETE FROM employees e
WHERE employee_id in
(SELECT employee_id
FROM emp_history
WHERE employee_id = e.employee_id);
5. 一个思考题
问题:谁的工资比Abel的高?
解答:
#方式1:自连接
SELECT e2.last_name,e2.salary
FROM employees e1,employees e2
WHERE e1.last_name = 'Abel'
AND e1.`salary` < e2.`salary`
#方式2:子查询
SELECT last_name,salary
FROM employees
WHERE salary > (
SELECT salary
FROM employees
WHERE last_name = 'Abel'
);
问题:以上两种方式有好坏之分吗?
解答:自连接方式好!
题目中可以使用子查询,也可以使用自连接。一般情况建议你使用自连接,因为在许多 DBMS 的处理过程中,对于自连接的处理速度要比子查询快得多。
可以这样理解:子查询实际上是通过未知表进行查询后的条件判断,而自连接是通过已知的自身数据表进行条件判断,因此在大部分 DBMS 中都对自连接处理进行了优化。