子查询指一个查询语句嵌套在另一个查询语句内部的查询,这个特性从MySQL 4.1开始引入。
SQL 中子查询的使用大大增强了 SELECT 查询的能力,因为很多时候查询需要从结果集中获取数据,或者需要从同一个表中先计算得出一个数据结果,然后与这个数据结果(可能是某个标量,也可能是某个集合)进行比较。
1. 需求分析与问题解决
1.1 实际问题

现有的解决方式:
-- 需求:谁的工资比Abel高-- 方式1:两次查询# 由具体的需求引入子查询SELECTemployee_id,last_name,salaryFROMemployeesWHERElast_name = 'Abel';SELECTemployee_id,last_name,salaryFROMemployeesWHEREsalary > 11000;-- 方式2:自连接SELECTe1.employee_id,e1.last_name,e1.salaryFROMemployees e1,employees e2WHEREe2.last_name = 'Abel'AND e1.salary > e2.salary;-- 方式3:子查询SELECTlast_name,salaryFROMemployeesWHEREsalary > ( SELECT salary FROM employees WHERE last_name = 'Abel' );-- 2. 称谓的规范:外查询(主插叙)和内查询(子查询)
1.2 子查询的基本使用
子查询的基本语法结构
SELECT select_listFROM `table`WHERE expr operator(SELECT select_list,FROM `table`);
子查询(内查询)在主查询之前一次完成
- 子查询的结果被主查询(外查询)使用
 - 注意事项
- 子查询需要被括号包起来
 - 一般将子查询放在比较条件的右侧
 - 单行操作符对应单行子查询,多行操作符对应多行子查询
 
 
1.3 子查询的分类
分类方式1:
按照子查询返回的是一行还是多行结果,分为单行子查询和多行子查询
- 单行子查询
 

- 多行子查询
 
分类方式2:
按照子查询是否被执行多次,分为相关(关联)子查询和不相关(非关联)子查询
子查询从数据表中查询了数据结果,如果这个数据结果只执行一次,然后这个数据结果作为主查询的条件进行执行,那么这样的子查询叫做不相关子查询。
同样,如果子查询需要执行多次,即采用循环的方式,先从外部查询开始,每次都传入子查询进行查询,然后再将结果反馈给外部,这种嵌套的执行方式就称为相关子查询。
相关子查询的需求:查询工资大于本部门平均工资的员工的信息 不相关子查询的需求:查询工资大于本公司平均公司的员工的信息
2. 单行子查询
2.1 单行操作符
| 操作符 | 含义 | 
|---|---|
| = | equal to | 
| > | greater than | 
| >= | greater than or equal to | 
| < | less than | 
| <= | less than or equal to | 
| <> | not equal to | 
2.2 代码示例
题目:查询工资大于149号员工工资的员工信息
-- 题目:查询工资大于149号员工工资的员工信息SELECTemployee_id,last_name,salaryFROMemployeesWHEREsalary > ( SELECT salary FROM employees WHERE employee_id = 149 );
题目:返回
job_id和141号员工相同,salary比143号员工多的员工姓名,job_id和工资
/* 题目:返回job_id和141号员工相同,salary比143号员工多的员工姓名,job_id和工资*/SELECTlast_name,job_id,salaryFROMemployeesWHEREjob_id = ( SELECT job_id FROM employees WHERE employee_id = 141 )AND salary > ( SELECT salary FROM employees WHERE employee_id = 143 );
题目:返回公司工资最少的员工的
last_name,job_id和salary
SELECTlast_name,job_id,salaryFROMemployeesWHEREsalary = ( SELECT MIN(salary) FROM employees );
题目:查询与141号或174号员工的
manager_id和department_id相同的其他员工的employee_id,manager_id,department_id注意:需要排除141号和174号两名员工本身
-- 方法1:不成对比较SELECTemployee_id,manager_id,department_idFROMemployeesWHEREmanager_id IN ( SELECT manager_id FROM employees WHERE employee_id IN ( 141, 174 ) )AND department_id IN ( SELECT department_id FROM employees WHERE employee_id IN ( 141, 174 ) )AND employee_id NOT IN ( 141, 174 );-- 方法2:成对比较SELECTemployee_id,manager_id,department_idFROMemployees-- 直接两个字段一起比较WHERE( manager_id, department_id ) IN ( SELECT manager_id, department_id FROM employees WHERE employee_id IN ( 141, 174 ) )AND employee_id NOT IN ( 141, 174 );

2.3 HAVING中的子查询
- 首先执行子查询
 - 再向主查询中的HAVING语句返回结果
问题:查询最低工资大于50号部门最低工资的部门id和其最低工资
 
-- 问题:查询最低工资大于50号部门最低工资的部门id和其最低工资SELECTe1.department_id,department_name,MIN(e1.salary)FROMemployees e1LEFT JOIN departments d ON e1.department_id = d.department_idGROUP BYe1.department_idHAVING MIN(e1.salary) > ( SELECT MIN(e2.salary) FROM employees e2 WHERE e2.department_id = 50 );
2.4 CASE中的子查询
在CASE表达式中使用单列子查询:
题目:显式员工的
employee_id,last_name和location。其中,若员工department_id与location_id为1800的department_id相同,则location为Canada,其余则为USA
SELECTemployee_id,last_name,CASEdepartment_idWHEN ( SELECT department_id FROM departments WHERE location_id = 1800 ) THEN'Canada' ELSE 'USA'END "location"FROMemployees;

2.5 子查询中的空值问题
可能子查询中查到的数据是不存在的,那么就会涉及到空值的问题。这种情况下,子查询不会返回任何数据
不会报错,但是结果集中也不会有任何的数据
2.6 非法使用子查询
多行子查询必须使用多行比较符,如果使用了单行比较符,就会出现非法使用子查询的问题
SELECT employee_id, last_nameFROM employeesWHERE salary =(SELECT MIN(salary)FROM employeesGROUP BY department_id);

3. 多行子查询
- 也称为集合比较子查询
 - 内查询返回多行
 - 使用多行比较符
3.1 多行比较操作符
| 操作符 | 含义 | | —- | —- | | IN | 等于列表中的任意一个 | | ANY | 需要和单行比较操作符一起使用,和子查询返回的某一个值比较 | | ALL | 需要和单行比较操作符一起使用,和子查询返回的所有值比较 | | SOME | 实际上是ANY的别名,作用相同,一般常使用ANY | 
3.2 代码示例
操作符:IN
-- INSELECT employee_id, last_nameFROM employeesWHERE salary IN(SELECT MIN(salary)FROM employeesGROUP BY department_id);

操作符:ANY/ALL
题目:返回其它
job_id中比job_id为IT_PROG部门任一工资低的员工的员工号、姓名job_id以及salary
-- 题目:返回其它job_id中比job_id为‘IT_PROG’部门所有工资都低的员工的员工号、姓名、job_id以及salarySELECTemployee_id,last_name,job_id,salaryFROMemployeesWHEREjob_id <> 'IT_PROG'AND salary < ANY ( SELECT salary FROM employees WHERE job_id = 'IT_PROG' );
题目:返回其它
job_id中比job_id为IT_PROG部门所有工资都低的员工的员工号、姓名、job_id以及salary
/*题目:返回其它job_id中比job_id为IT_PROG部门所有工资都低的员工的员工号、姓名、job_id以及salary*/SELECTemployee_id,last_name,job_id,salaryFROMemployeesWHEREjob_id <> 'IT_PROG'AND salary < ALL ( SELECT salary FROM employees WHERE job_id = 'IT_PROG' );
题目:查询平均工资最低的部门
department_id
/*查询平均工资最低的部门的部门id*/SELECTdepartment_id,AVG(salary)FROMemployeesGROUP BYdepartment_idHAVINGAVG(salary) <= ALL ( SELECT AVG(salary) FROM employees GROUP BY department_id );
可以将子查询的结果集当作一张虚拟的数据表来使用
-- 将子查询的结果当作一张表来使用/*查询平均工资最低的部门的部门id*/SELECTMIN(`avg_salary`)FROM( SELECT AVG(salary) `avg_salary` FROM employees GROUP BY department_id ) `t_avg_salary`;
3.3 空值问题
SELECT last_nameFROM employeesWHERE employee_id NOT IN (SELECT manager_idFROM employees);
4. 相关子查询
4.1 相关子查询的查询流程
如果子查询的执行依赖于外部查询,通常情况下都是因为子查询中的表用到了外部的表,并进行了条件关联,因此每执行一次外部查询,子查询都要重新计算一次,这样的子查询就称之为关联子查询。
相关子查询按照一行接一行的顺序执行,主查询的每一行都执行一次子查询。
说明:子查询中使用主查询中的列(子查询用到的数据和主查询是有关联的)
4.2 代码示例
回顾:查询员工中工资大于本公司平均工资的员工的
last_name,salary和department_id
-- 回顾:查询员工中工资大于本公司平均工资的员工的last_name,salary和其department_idSELECTlast_name,salary,department_idFROMemployeesWHEREsalary > ( SELECT AVG(salary) FROM employees );
题目:查询员工中工资大于本部门平均工资的员工的
last_name,salary和其department_id
方法一:使用相关子查询
-- 题目:查询员工中工资大于本部门平均工资的员工的last_name,salary和其department_idSELECTe1.last_name,e1.salary,e1.department_idFROMemployees e1WHEREe1.salary > ( SELECT AVG(e2.salary) FROM employees e2 WHERE e1.department_id = e2.department_id );
方法二:在FROM中使用子查询
-- 方法2:在FROM中使用子查询SELECTe1.last_name,e1.salary,e1.department_idFROMemployees e1,( SELECT department_id,AVG(salary) `avg_salary` FROM employees GROUP BY department_id ) e2WHEREe1.department_id = e2.department_idAND e1.salary > e2.`avg_salary`;
from型的子查询:子查询是作为from的一部分,子查询要用()引起来,并且要给这个子查询取别名,把它当成一张“临时的虚拟的表”来使用。
题目:查询员工的
id,salary,按照department_name排序
-- 题目:查询员工的id,salary,按照department_name 排序SELECTe.employee_id,e.department_id,e.salaryFROMemployees eORDER BY ( SELECT department_name FROM departments d WHERE e.department_id = d.department_id );
可以使用子查询的位置:在SELECT中,除了GROUP BY和 LIMIT之外,其他的位置都是可以声明子查询的
题目:若
employees表中employee_id与job_history表中employee_id相同的数目不小于2,输出这些相同id的员工的employee_id,last_name和其job_id
/*题目:若employees表中employee_id与job_history表中employee_id相同的数目不小于2,输出这些相同id的员工的employee_id,last_name和其job_id*/SELECTe1.employee_id,e1.last_name,e1.job_idFROMemployees e1WHERE2 <= ( SELECT COUNT(*) FROM job_history j WHERE j.employee_id = e1.employee_id );

4.3 EXISTS和NOT EXISTS
- 关联子查询通常也会与
EXISTS操作符一起来使用,用来检查在子查询中是否存在满足条件的行 - 如果在子查询中不存在满足条件的行
- 条件返回
FALSE - 继续在子查询中进行查找
 
 - 条件返回
 - 如果在子查询中存在满足条件的行
- 退出子查询
 - 条件返回
TRUE 
 NOT EXISTS关键字表示如果不存在某种条件,就返回TRUE,否则返回FALSE
题目:查询公司管理者的employee_id,last_name,job_id,department_id信息
方法1:自连接
-- 方法1:自连接SELECTDISTINCTmgr.employee_id,mgr.last_name,mgr.job_id,mgr.department_idFROMemployees eJOIN employees mgr ON e.manager_id = mgr.employee_id;
方法2:子查询
先查出所有管理者的
id
SELECTe.employee_id,e.last_name,e.job_id,e.department_idFROMemployees eWHEREe.employee_id IN ( SELECT DISTINCT e1.manager_id FROM employees e1 WHERE e1.manager_id );
方法3:EXISTS
SELECTe2.employee_id,e2.last_name,e2.job_id,e2.department_idFROMemployees e2WHERE EXISTS ( SELECT * FROM employees e1 WHERE e2.employee_id = e1.manager_id );
题目:查询
departments表中,不存在于employees表中的部门的department_id和department_name
方法1:右连接
SELECTd.department_id,d.department_nameFROMemployees eRIGHT JOIN departments d ON e.department_id = d.department_idWHEREe.department_id IS NULL;
方法2:NOT EXISTS
-- 方法2:NOT EXISTSSELECTd1.department_id,d1.department_nameFROMdepartments d1WHERE NOT EXISTS ( SELECT * FROM employees e WHERE e.department_id = d1.department_id );
4.4 相关更新
UPDATE table1 alias1SET column = (SELECT expressionFROM table2 alias2WHERE alias1.column = alias2.column);
使用相关子查询依据一个表中的数据更新另一个表的数据。
题目:在employees中增加一个department_name字段,数据为员工对应的部门名称
# 1)ALTER TABLE employeesADD(department_name VARCHAR2(14));# 2)UPDATE employees eSET department_name = (SELECT department_nameFROM departments dWHERE e.department_id = d.department_id);
4.5 相关删除
DELETE FROM table1 alias1WHERE column operator (SELECT expressionFROM table2 alias2WHERE alias1.column = alias2.column);
使用相关子查询依据一个表中的数据删除另一个表的数据。
题目:删除表employees中,其与emp_history表皆有的数据
DELETE FROM employees eWHERE employee_id in(SELECT employee_idFROM emp_historyWHERE employee_id = e.employee_id);
5. 一个思考题
问题:谁的工资比Abel的高?
解答:
#方式1:自连接SELECT e2.last_name,e2.salaryFROM employees e1,employees e2WHERE e1.last_name = 'Abel'AND e1.`salary` < e2.`salary`
#方式2:子查询SELECT last_name,salaryFROM employeesWHERE salary > (SELECT salaryFROM employeesWHERE last_name = 'Abel');
问题:以上两种方式有好坏之分吗?
解答:自连接方式好!
题目中可以使用子查询,也可以使用自连接。一般情况建议你使用自连接,因为在许多 DBMS 的处理过程中,对于自连接的处理速度要比子查询快得多。
可以这样理解:子查询实际上是通过未知表进行查询后的条件判断,而自连接是通过已知的自身数据表进行条件判断,因此在大部分 DBMS 中都对自连接处理进行了优化。
