MySQL学习笔记

登录和退出MySQL服务器

  1. # 登录MySQL
  2. $ mysql -u root -proot
  3. # 退出MySQL数据库服务器
  4. exit;

基本语法

  1. -- 显示所有数据库
  2. show databases;
  3. -- 创建数据库
  4. CREATE DATABASE test;
  5. -- 切换数据库
  6. use test;
  7. -- 显示数据库中的所有表
  8. show tables;
  9. -- 创建数据表
  10. CREATE TABLE pet (
  11. name VARCHAR(20),
  12. owner VARCHAR(20),
  13. species VARCHAR(20),
  14. sex CHAR(1),
  15. birth DATE,
  16. death DATE
  17. );
  18. -- 查看数据表结构
  19. -- describe pet;
  20. desc pet;
  21. -- 查询表
  22. SELECT * from pet;
  23. -- 插入数据
  24. INSERT INTO pet VALUES ('puffball', 'Diane', 'hamster', 'f', '1990-03-30', NULL);
  25. -- 修改数据
  26. UPDATE pet SET name = 'squirrel' where owner = 'Diane';
  27. -- 删除数据
  28. DELETE FROM pet where name = 'squirrel';
  29. -- 删除表
  30. DROP TABLE myorder;

建表约束

主键约束

  1. -- 主键约束
  2. -- 使某个字段不重复且不得为空,确保表内所有数据的唯一性。
  3. CREATE TABLE user (
  4. id INT PRIMARY KEY,
  5. name VARCHAR(20)
  6. );
  7. -- 联合主键
  8. -- 联合主键中的每个字段都不能为空,并且加起来不能和已设置的联合主键重复。
  9. CREATE TABLE user (
  10. id INT,
  11. name VARCHAR(20),
  12. password VARCHAR(20),
  13. PRIMARY KEY(id, name)
  14. );
  15. -- 自增约束
  16. -- 自增约束的主键由系统自动递增分配。
  17. CREATE TABLE user (
  18. id INT PRIMARY KEY AUTO_INCREMENT,
  19. name VARCHAR(20)
  20. );
  21. -- 添加主键约束
  22. -- 如果忘记设置主键,还可以通过SQL语句设置(两种方式):
  23. ALTER TABLE user ADD PRIMARY KEY(id);
  24. ALTER TABLE user MODIFY id INT PRIMARY KEY;
  25. -- 删除主键
  26. ALTER TABLE user drop PRIMARY KEY;

唯一主键

  1. -- 建表时创建唯一主键
  2. CREATE TABLE user (
  3. id INT,
  4. name VARCHAR(20),
  5. UNIQUE(name)
  6. );
  7. -- 添加唯一主键
  8. -- 如果建表时没有设置唯一建,还可以通过SQL语句设置(两种方式):
  9. ALTER TABLE user ADD UNIQUE(name);
  10. ALTER TABLE user MODIFY name VARCHAR(20) UNIQUE;
  11. -- 删除唯一主键
  12. ALTER TABLE user DROP INDEX name;

非空约束

  1. -- 建表时添加非空约束
  2. -- 约束某个字段不能为空
  3. CREATE TABLE user (
  4. id INT,
  5. name VARCHAR(20) NOT NULL
  6. );
  7. -- 移除非空约束
  8. ALTER TABLE user MODIFY name VARCHAR(20);

默认约束

  1. -- 建表时添加默认约束
  2. -- 约束某个字段的默认值
  3. CREATE TABLE user2 (
  4. id INT,
  5. name VARCHAR(20),
  6. age INT DEFAULT 10
  7. );
  8. -- 移除非空约束
  9. ALTER TABLE user MODIFY age INT;

外键约束

  1. -- 班级
  2. CREATE TABLE classes (
  3. id INT PRIMARY KEY,
  4. name VARCHAR(20)
  5. );
  6. -- 学生表
  7. CREATE TABLE students (
  8. id INT PRIMARY KEY,
  9. name VARCHAR(20),
  10. -- 这里的 class_id 要和 classes 中的 id 字段相关联
  11. class_id INT,
  12. -- 表示 class_id 的值必须来自于 classes 中的 id 字段值
  13. FOREIGN KEY(class_id) REFERENCES classes(id)
  14. );
  15. -- 1. 主表(父表)classes 中没有的数据值,在副表(子表)students 中,是不可以使用的;
  16. -- 2. 主表中的记录被副表引用时,主表不可以被删除。

数据库的三大设计范式

1NF

只要字段值还可以继续拆分,就不满足第一范式。

范式设计得越详细,对某些实际操作可能会更好,但并非都有好处,需要对项目的实际情况进行设定。

2NF

在满足第一范式的前提下,其他列都必须完全依赖于主键列。如果出现不完全依赖,只可能发生在联合主键的情况下:

  1. -- 订单表
  2. CREATE TABLE myorder (
  3. product_id INT,
  4. customer_id INT,
  5. product_name VARCHAR(20),
  6. customer_name VARCHAR(20),
  7. PRIMARY KEY (product_id, customer_id)
  8. );

实际上,在这张订单表中,product_name 只依赖于 product_idcustomer_name 只依赖于 customer_id 。也就是说,product_namecustomer_id 是没用关系的,customer_nameproduct_id 也是没有关系的。

这就不满足第二范式:其他列都必须完全依赖于主键列!

  1. CREATE TABLE myorder (
  2. order_id INT PRIMARY KEY,
  3. product_id INT,
  4. customer_id INT
  5. );
  6. CREATE TABLE product (
  7. id INT PRIMARY KEY,
  8. name VARCHAR(20)
  9. );
  10. CREATE TABLE customer (
  11. id INT PRIMARY KEY,
  12. name VARCHAR(20)
  13. );

拆分之后,myorder 表中的 product_idcustomer_id 完全依赖于 order_id 主键,而 productcustomer 表中的其他字段又完全依赖于主键。满足了第二范式的设计!

3NF

在满足第二范式的前提下,除了主键列之外,其他列之间不能有传递依赖关系。

  1. CREATE TABLE myorder (
  2. order_id INT PRIMARY KEY,
  3. product_id INT,
  4. customer_id INT,
  5. customer_phone VARCHAR(15)
  6. );

表中的 customer_phone 有可能依赖于 order_idcustomer_id 两列,也就不满足了第三范式的设计:其他列之间不能有传递依赖关系。

  1. CREATE TABLE myorder (
  2. order_id INT PRIMARY KEY,
  3. product_id INT,
  4. customer_id INT
  5. );
  6. CREATE TABLE customer (
  7. id INT PRIMARY KEY,
  8. name VARCHAR(20),
  9. phone VARCHAR(15)
  10. );

修改后就不存在其他列之间的传递依赖关系,其他列都只依赖于主键列,满足了第三范式的设计!

查询练习

准备数据

  1. -- 创建数据库
  2. CREATE DATABASE select_test;
  3. -- 切换数据库
  4. USE select_test;
  5. -- 创建学生表
  6. CREATE TABLE student (
  7. no VARCHAR(20) PRIMARY KEY,
  8. name VARCHAR(20) NOT NULL,
  9. sex VARCHAR(10) NOT NULL,
  10. birthday DATE, -- 生日
  11. class VARCHAR(20) -- 所在班级
  12. );
  13. -- 创建教师表
  14. CREATE TABLE teacher (
  15. no VARCHAR(20) PRIMARY KEY,
  16. name VARCHAR(20) NOT NULL,
  17. sex VARCHAR(10) NOT NULL,
  18. birthday DATE,
  19. profession VARCHAR(20) NOT NULL, -- 职称
  20. department VARCHAR(20) NOT NULL -- 部门
  21. );
  22. -- 创建课程表
  23. CREATE TABLE course (
  24. no VARCHAR(20) PRIMARY KEY,
  25. name VARCHAR(20) NOT NULL,
  26. t_no VARCHAR(20) NOT NULL, -- 教师编号
  27. -- 表示该 tno 来自于 teacher 表中的 no 字段值
  28. FOREIGN KEY(t_no) REFERENCES teacher(no)
  29. );
  30. -- 成绩表
  31. CREATE TABLE score (
  32. s_no VARCHAR(20) NOT NULL, -- 学生编号
  33. c_no VARCHAR(20) NOT NULL, -- 课程号
  34. degree DECIMAL, -- 成绩
  35. -- 表示该 s_no, c_no 分别来自于 student, course 表中的 no 字段值
  36. FOREIGN KEY(s_no) REFERENCES student(no),
  37. FOREIGN KEY(c_no) REFERENCES course(no),
  38. -- 设置 s_no, c_no 为联合主键
  39. PRIMARY KEY(s_no, c_no)
  40. );
  41. -- 查看所有表
  42. SHOW TABLES;
  43. -- 添加学生表数据
  44. INSERT INTO student VALUES('101', '曾华', '男', '1977-09-01', '95033');
  45. INSERT INTO student VALUES('102', '匡明', '男', '1975-10-02', '95031');
  46. INSERT INTO student VALUES('103', '王丽', '女', '1976-01-23', '95033');
  47. INSERT INTO student VALUES('104', '李军', '男', '1976-02-20', '95033');
  48. INSERT INTO student VALUES('105', '王芳', '女', '1975-02-10', '95031');
  49. INSERT INTO student VALUES('106', '陆军', '男', '1974-06-03', '95031');
  50. INSERT INTO student VALUES('107', '王尼玛', '男', '1976-02-20', '95033');
  51. INSERT INTO student VALUES('108', '张全蛋', '男', '1975-02-10', '95031');
  52. INSERT INTO student VALUES('109', '赵铁柱', '男', '1974-06-03', '95031');
  53. -- 添加教师表数据
  54. INSERT INTO teacher VALUES('804', '李诚', '男', '1958-12-02', '副教授', '计算机系');
  55. INSERT INTO teacher VALUES('856', '张旭', '男', '1969-03-12', '讲师', '电子工程系');
  56. INSERT INTO teacher VALUES('825', '王萍', '女', '1972-05-05', '助教', '计算机系');
  57. INSERT INTO teacher VALUES('831', '刘冰', '女', '1977-08-14', '助教', '电子工程系');
  58. -- 添加课程表数据
  59. INSERT INTO course VALUES('3-105', '计算机导论', '825');
  60. INSERT INTO course VALUES('3-245', '操作系统', '804');
  61. INSERT INTO course VALUES('6-166', '数字电路', '856');
  62. INSERT INTO course VALUES('9-888', '高等数学', '831');
  63. -- 添加添加成绩表数据
  64. INSERT INTO score VALUES('103', '3-105', '92');
  65. INSERT INTO score VALUES('103', '3-245', '86');
  66. INSERT INTO score VALUES('103', '6-166', '85');
  67. INSERT INTO score VALUES('105', '3-105', '88');
  68. INSERT INTO score VALUES('105', '3-245', '75');
  69. INSERT INTO score VALUES('105', '6-166', '79');
  70. INSERT INTO score VALUES('109', '3-105', '76');
  71. INSERT INTO score VALUES('109', '3-245', '68');
  72. INSERT INTO score VALUES('109', '6-166', '81');
  73. -- 查看表结构
  74. SELECT * FROM course;
  75. SELECT * FROM score;
  76. SELECT * FROM student;
  77. SELECT * FROM teacher;

1 到 10

  1. -- 查询 student 表的所有行
  2. SELECT * FROM student;
  3. -- 查询 student 表中的 namesex class 字段的所有行
  4. SELECT name, sex, class FROM student;
  5. -- 查询 teacher 表中不重复的 department
  6. -- department: 去重查询
  7. SELECT DISTINCT department FROM teacher;
  8. -- 查询 score 表中成绩在60-80之间的所有行(区间查询和运算符查询)
  9. -- BETWEEN xx AND xx: 查询区间, AND 表示 "并且"
  10. SELECT * FROM score WHERE degree BETWEEN 60 AND 80;
  11. SELECT * FROM score WHERE degree > 60 AND degree < 80;
  12. -- 查询 score 表中成绩为 85, 86 88 的行
  13. -- IN: 查询规定中的多个值
  14. SELECT * FROM score WHERE degree IN (85, 86, 88);
  15. -- 查询 student 表中 '95031' 班或性别为 '女' 的所有行
  16. -- or: 表示或者关系
  17. SELECT * FROM student WHERE class = '95031' or sex = '女';
  18. -- class 降序的方式查询 student 表的所有行
  19. -- DESC: 降序,从高到低
  20. -- ASC(默认): 升序,从低到高
  21. SELECT * FROM student ORDER BY class DESC;
  22. SELECT * FROM student ORDER BY class ASC;
  23. -- c_no 升序、degree 降序查询 score 表的所有行
  24. SELECT * FROM score ORDER BY c_no ASC, degree DESC;
  25. -- 查询 "95031" 班的学生人数
  26. -- COUNT: 统计
  27. SELECT COUNT(*) FROM student WHERE class = '95031';
  28. -- 查询 score 表中的最高分的学生学号和课程编号(子查询或排序查询)。
  29. -- (SELECT MAX(degree) FROM score): 子查询,算出最高分
  30. SELECT s_no, c_no FROM score WHERE degree = (SELECT MAX(degree) FROM score);
  31. -- 排序查询
  32. -- LIMIT r, n: 表示从第r行开始,查询n条数据
  33. SELECT s_no, c_no, degree FROM score ORDER BY degree DESC LIMIT 0, 1;

分组计算平均成绩

查询每门课的平均成绩。

  1. -- AVG: 平均值
  2. SELECT AVG(degree) FROM score WHERE c_no = '3-105';
  3. SELECT AVG(degree) FROM score WHERE c_no = '3-245';
  4. SELECT AVG(degree) FROM score WHERE c_no = '6-166';
  5. -- GROUP BY: 分组查询
  6. SELECT c_no, AVG(degree) FROM score GROUP BY c_no;

分组条件与模糊查询

查询 **score** 表中至少有 2 名学生选修,并以 3 开头的课程的平均分数。

  1. SELECT * FROM score;
  2. -- c_no 课程编号
  3. +------+-------+--------+
  4. | s_no | c_no | degree |
  5. +------+-------+--------+
  6. | 103 | 3-105 | 92 |
  7. | 103 | 3-245 | 86 |
  8. | 103 | 6-166 | 85 |
  9. | 105 | 3-105 | 88 |
  10. | 105 | 3-245 | 75 |
  11. | 105 | 6-166 | 79 |
  12. | 109 | 3-105 | 76 |
  13. | 109 | 3-245 | 68 |
  14. | 109 | 6-166 | 81 |
  15. +------+-------+--------+

分析表发现,至少有 2 名学生选修的课程是 3-1053-2456-166 ,以 3 开头的课程是 3-1053-245 。也就是说,我们要查询所有 3-1053-245degree 平均分。

  1. -- 首先把 c_no, AVG(degree) 通过分组查询出来
  2. SELECT c_no, AVG(degree) FROM score GROUP BY c_no
  3. +-------+-------------+
  4. | c_no | AVG(degree) |
  5. +-------+-------------+
  6. | 3-105 | 85.3333 |
  7. | 3-245 | 76.3333 |
  8. | 6-166 | 81.6667 |
  9. +-------+-------------+
  10. -- 再查询出至少有 2 名学生选修的课程
  11. -- HAVING: 表示持有
  12. HAVING COUNT(c_no) >= 2
  13. -- 并且是以 3 开头的课程
  14. -- LIKE 表示模糊查询,"%" 是一个通配符,匹配 "3" 后面的任意字符。
  15. AND c_no LIKE '3%';
  16. -- 把前面的SQL语句拼接起来,
  17. -- 后面加上一个 COUNT(*),表示将每个分组的个数也查询出来。
  18. SELECT c_no, AVG(degree), COUNT(*) FROM score GROUP BY c_no
  19. HAVING COUNT(c_no) >= 2 AND c_no LIKE '3%';
  20. +-------+-------------+----------+
  21. | c_no | AVG(degree) | COUNT(*) |
  22. +-------+-------------+----------+
  23. | 3-105 | 85.3333 | 3 |
  24. | 3-245 | 76.3333 | 3 |
  25. +-------+-------------+----------+

多表查询 - 1

查询所有学生的 **name**,以及该学生在 **score** 表中对应的 **c_no****degree**

  1. SELECT no, name FROM student;
  2. +-----+-----------+
  3. | no | name |
  4. +-----+-----------+
  5. | 101 | 曾华 |
  6. | 102 | 匡明 |
  7. | 103 | 王丽 |
  8. | 104 | 李军 |
  9. | 105 | 王芳 |
  10. | 106 | 陆军 |
  11. | 107 | 王尼玛 |
  12. | 108 | 张全蛋 |
  13. | 109 | 赵铁柱 |
  14. +-----+-----------+
  15. SELECT s_no, c_no, degree FROM score;
  16. +------+-------+--------+
  17. | s_no | c_no | degree |
  18. +------+-------+--------+
  19. | 103 | 3-105 | 92 |
  20. | 103 | 3-245 | 86 |
  21. | 103 | 6-166 | 85 |
  22. | 105 | 3-105 | 88 |
  23. | 105 | 3-245 | 75 |
  24. | 105 | 6-166 | 79 |
  25. | 109 | 3-105 | 76 |
  26. | 109 | 3-245 | 68 |
  27. | 109 | 6-166 | 81 |
  28. +------+-------+--------+

通过分析可以发现,只要把 score 表中的 s_no 字段值替换成 student 表中对应的 name 字段值就可以了,如何做呢?

  1. -- FROM...: 表示从 student, score 表中查询
  2. -- WHERE 的条件表示为,只有在 student.no score.s_no 相等时才显示出来。
  3. SELECT name, c_no, degree FROM student, score
  4. WHERE student.no = score.s_no;
  5. +-----------+-------+--------+
  6. | name | c_no | degree |
  7. +-----------+-------+--------+
  8. | 王丽 | 3-105 | 92 |
  9. | 王丽 | 3-245 | 86 |
  10. | 王丽 | 6-166 | 85 |
  11. | 王芳 | 3-105 | 88 |
  12. | 王芳 | 3-245 | 75 |
  13. | 王芳 | 6-166 | 79 |
  14. | 赵铁柱 | 3-105 | 76 |
  15. | 赵铁柱 | 3-245 | 68 |
  16. | 赵铁柱 | 6-166 | 81 |
  17. +-----------+-------+--------+

多表查询 - 2

查询所有学生的 **no** 、课程名称 ( **course** 表中的 **name** ) 和成绩 ( **score** 表中的 **degree** ) 列。

只有 score 关联学生的 no ,因此只要查询 score 表,就能找出所有和学生相关的 nodegree

  1. SELECT s_no, c_no, degree FROM score;
  2. +------+-------+--------+
  3. | s_no | c_no | degree |
  4. +------+-------+--------+
  5. | 103 | 3-105 | 92 |
  6. | 103 | 3-245 | 86 |
  7. | 103 | 6-166 | 85 |
  8. | 105 | 3-105 | 88 |
  9. | 105 | 3-245 | 75 |
  10. | 105 | 6-166 | 79 |
  11. | 109 | 3-105 | 76 |
  12. | 109 | 3-245 | 68 |
  13. | 109 | 6-166 | 81 |
  14. +------+-------+--------+

然后查询 course 表:

  1. +-------+-----------------+
  2. | no | name |
  3. +-------+-----------------+
  4. | 3-105 | 计算机导论 |
  5. | 3-245 | 操作系统 |
  6. | 6-166 | 数字电路 |
  7. | 9-888 | 高等数学 |
  8. +-------+-----------------+

只要把 score 表中的 c_no 替换成 course 表中对应的 name 字段值就可以了。

  1. -- 增加一个查询字段 name,分别从 scorecourse 这两个表中查询。
  2. -- as 表示取一个该字段的别名。
  3. SELECT s_no, name as c_name, degree FROM score, course
  4. WHERE score.c_no = course.no;
  5. +------+-----------------+--------+
  6. | s_no | c_name | degree |
  7. +------+-----------------+--------+
  8. | 103 | 计算机导论 | 92 |
  9. | 105 | 计算机导论 | 88 |
  10. | 109 | 计算机导论 | 76 |
  11. | 103 | 操作系统 | 86 |
  12. | 105 | 操作系统 | 75 |
  13. | 109 | 操作系统 | 68 |
  14. | 103 | 数字电路 | 85 |
  15. | 105 | 数字电路 | 79 |
  16. | 109 | 数字电路 | 81 |
  17. +------+-----------------+--------+

三表关联查询

查询所有学生的 **name** 、课程名 ( **course** 表中的 **name** ) 和 **degree**

只有 score 表中关联学生的学号和课堂号,我们只要围绕着 score 这张表查询就好了。

  1. SELECT * FROM score;
  2. +------+-------+--------+
  3. | s_no | c_no | degree |
  4. +------+-------+--------+
  5. | 103 | 3-105 | 92 |
  6. | 103 | 3-245 | 86 |
  7. | 103 | 6-166 | 85 |
  8. | 105 | 3-105 | 88 |
  9. | 105 | 3-245 | 75 |
  10. | 105 | 6-166 | 79 |
  11. | 109 | 3-105 | 76 |
  12. | 109 | 3-245 | 68 |
  13. | 109 | 6-166 | 81 |
  14. +------+-------+--------+

只要把 s_noc_no 替换成 studentsrouse 表中对应的 name 字段值就好了。

首先把 s_no 替换成 student 表中的 name 字段:

  1. SELECT name, c_no, degree FROM student, score WHERE student.no = score.s_no;
  2. +-----------+-------+--------+
  3. | name | c_no | degree |
  4. +-----------+-------+--------+
  5. | 王丽 | 3-105 | 92 |
  6. | 王丽 | 3-245 | 86 |
  7. | 王丽 | 6-166 | 85 |
  8. | 王芳 | 3-105 | 88 |
  9. | 王芳 | 3-245 | 75 |
  10. | 王芳 | 6-166 | 79 |
  11. | 赵铁柱 | 3-105 | 76 |
  12. | 赵铁柱 | 3-245 | 68 |
  13. | 赵铁柱 | 6-166 | 81 |
  14. +-----------+-------+--------+

再把 c_no 替换成 course 表中的 name 字段:

  1. -- 课程表
  2. SELECT no, name FROM course;
  3. +-------+-----------------+
  4. | no | name |
  5. +-------+-----------------+
  6. | 3-105 | 计算机导论 |
  7. | 3-245 | 操作系统 |
  8. | 6-166 | 数字电路 |
  9. | 9-888 | 高等数学 |
  10. +-------+-----------------+
  11. -- 由于字段名存在重复,使用 "表名.字段名 as 别名" 代替。
  12. SELECT student.name as s_name, course.name as c_name, degree
  13. FROM student, score, course
  14. WHERE student.NO = score.s_no
  15. AND score.c_no = course.no;

子查询加分组求平均分

查询 **95031** 班学生每门课程的平均成绩。

score 表中根据 student 表的学生编号筛选出学生的课堂号和成绩:

  1. -- IN (..): 将筛选出的学生号当做 s_no 的条件查询
  2. SELECT s_no, c_no, degree FROM score
  3. WHERE s_no IN (SELECT no FROM student WHERE class = '95031');
  4. +------+-------+--------+
  5. | s_no | c_no | degree |
  6. +------+-------+--------+
  7. | 105 | 3-105 | 88 |
  8. | 105 | 3-245 | 75 |
  9. | 105 | 6-166 | 79 |
  10. | 109 | 3-105 | 76 |
  11. | 109 | 3-245 | 68 |
  12. | 109 | 6-166 | 81 |
  13. +------+-------+--------+

这时只要将 c_no 分组一下就能得出 95031 班学生每门课的平均成绩:

  1. SELECT c_no, AVG(degree) FROM score
  2. WHERE s_no IN (SELECT no FROM student WHERE class = '95031')
  3. GROUP BY c_no;
  4. +-------+-------------+
  5. | c_no | AVG(degree) |
  6. +-------+-------------+
  7. | 3-105 | 82.0000 |
  8. | 3-245 | 71.5000 |
  9. | 6-166 | 80.0000 |
  10. +-------+-------------+

子查询 - 1

查询在 **3-105** 课程中,所有成绩高于 **109** 号同学的记录。

首先筛选出课堂号为 3-105 ,在找出所有成绩高于 109 号同学的的行。

  1. SELECT * FROM score
  2. WHERE c_no = '3-105'
  3. AND degree > (SELECT degree FROM score WHERE s_no = '109' AND c_no = '3-105');

子查询 - 2

查询所有成绩高于 **109** 号同学的 **3-105** 课程成绩记录。

  1. -- 不限制课程号,只要成绩大于109号同学的3-105课程成绩就可以。
  2. SELECT * FROM score
  3. WHERE degree > (SELECT degree FROM score WHERE s_no = '109' AND c_no = '3-105');

YEAR 函数与带 IN 关键字查询

查询所有和 **101****108** 号学生同年出生的 **no****name****birthday** 列。

  1. -- YEAR(..): 取出日期中的年份
  2. SELECT no, name, birthday FROM student
  3. WHERE YEAR(birthday) IN (SELECT YEAR(birthday) FROM student WHERE no IN (101, 108));

多层嵌套子查询

查询 **'张旭'** 教师任课的学生成绩表。

首先找到教师编号:

  1. SELECT NO FROM teacher WHERE NAME = '张旭'

通过 sourse 表找到该教师课程号:

  1. SELECT NO FROM course WHERE t_no = ( SELECT NO FROM teacher WHERE NAME = '张旭' );

通过筛选出的课程号查询成绩表:

  1. SELECT * FROM score WHERE c_no = (
  2. SELECT no FROM course WHERE t_no = (
  3. SELECT no FROM teacher WHERE NAME = '张旭'
  4. )
  5. );

多表查询

查询某选修课程多于5个同学的教师姓名。

首先在 teacher 表中,根据 no 字段来判断该教师的同一门课程是否有至少5名学员选修:

  1. -- 查询 teacher
  2. SELECT no, name FROM teacher;
  3. +-----+--------+
  4. | no | name |
  5. +-----+--------+
  6. | 804 | 李诚 |
  7. | 825 | 王萍 |
  8. | 831 | 刘冰 |
  9. | 856 | 张旭 |
  10. +-----+--------+
  11. SELECT name FROM teacher WHERE no IN (
  12. -- 在这里找到对应的条件
  13. );

查看和教师编号有有关的表的信息:

  1. SELECT * FROM course;
  2. -- t_no: 教师编号
  3. +-------+-----------------+------+
  4. | no | name | t_no |
  5. +-------+-----------------+------+
  6. | 3-105 | 计算机导论 | 825 |
  7. | 3-245 | 操作系统 | 804 |
  8. | 6-166 | 数字电路 | 856 |
  9. | 9-888 | 高等数学 | 831 |
  10. +-------+-----------------+------+

我们已经找到和教师编号有关的字段就在 course 表中,但是还无法知道哪门课程至少有5名学生选修,所以还需要根据 score 表来查询:

  1. -- 在此之前向 score 插入一些数据,以便丰富查询条件。
  2. INSERT INTO score VALUES ('101', '3-105', '90');
  3. INSERT INTO score VALUES ('102', '3-105', '91');
  4. INSERT INTO score VALUES ('104', '3-105', '89');
  5. -- 查询 score
  6. SELECT * FROM score;
  7. +------+-------+--------+
  8. | s_no | c_no | degree |
  9. +------+-------+--------+
  10. | 101 | 3-105 | 90 |
  11. | 102 | 3-105 | 91 |
  12. | 103 | 3-105 | 92 |
  13. | 103 | 3-245 | 86 |
  14. | 103 | 6-166 | 85 |
  15. | 104 | 3-105 | 89 |
  16. | 105 | 3-105 | 88 |
  17. | 105 | 3-245 | 75 |
  18. | 105 | 6-166 | 79 |
  19. | 109 | 3-105 | 76 |
  20. | 109 | 3-245 | 68 |
  21. | 109 | 6-166 | 81 |
  22. +------+-------+--------+
  23. -- score 表中将 c_no 作为分组,并且限制 c_no 持有至少 5 条数据。
  24. SELECT c_no FROM score GROUP BY c_no HAVING COUNT(*) > 5;
  25. +-------+
  26. | c_no |
  27. +-------+
  28. | 3-105 |
  29. +-------+

根据筛选出来的课程号,找出在某课程中,拥有至少5名学员的教师编号:

  1. SELECT t_no FROM course WHERE no IN (
  2. SELECT c_no FROM score GROUP BY c_no HAVING COUNT(*) > 5
  3. );
  4. +------+
  5. | t_no |
  6. +------+
  7. | 825 |
  8. +------+

teacher 表中,根据筛选出来的教师编号找到教师姓名:

  1. SELECT name FROM teacher WHERE no IN (
  2. -- 最终条件
  3. SELECT t_no FROM course WHERE no IN (
  4. SELECT c_no FROM score GROUP BY c_no HAVING COUNT(*) > 5
  5. )
  6. );

子查询 - 3

查询 “计算机系” 课程的成绩表。

思路是,先找出 course 表中所有 计算机系 课程的编号,然后根据这个编号查询 score 表。

  1. -- 通过 teacher 表查询所有 `计算机系` 的教师编号
  2. SELECT no, name, department FROM teacher WHERE department = '计算机系'
  3. +-----+--------+--------------+
  4. | no | name | department |
  5. +-----+--------+--------------+
  6. | 804 | 李诚 | 计算机系 |
  7. | 825 | 王萍 | 计算机系 |
  8. +-----+--------+--------------+
  9. -- 通过 course 表查询该教师的课程编号
  10. SELECT no FROM course WHERE t_no IN (
  11. SELECT no FROM teacher WHERE department = '计算机系'
  12. );
  13. +-------+
  14. | no |
  15. +-------+
  16. | 3-245 |
  17. | 3-105 |
  18. +-------+
  19. -- 根据筛选出来的课程号查询成绩表
  20. SELECT * FROM score WHERE c_no IN (
  21. SELECT no FROM course WHERE t_no IN (
  22. SELECT no FROM teacher WHERE department = '计算机系'
  23. )
  24. );
  25. +------+-------+--------+
  26. | s_no | c_no | degree |
  27. +------+-------+--------+
  28. | 103 | 3-245 | 86 |
  29. | 105 | 3-245 | 75 |
  30. | 109 | 3-245 | 68 |
  31. | 101 | 3-105 | 90 |
  32. | 102 | 3-105 | 91 |
  33. | 103 | 3-105 | 92 |
  34. | 104 | 3-105 | 89 |
  35. | 105 | 3-105 | 88 |
  36. | 109 | 3-105 | 76 |
  37. +------+-------+--------+

UNION 和 NOTIN 的使用

查询 **计算机系****电子工程系** 中的不同职称的教师。

  1. -- NOT: 代表逻辑非
  2. SELECT * FROM teacher WHERE department = '计算机系' AND profession NOT IN (
  3. SELECT profession FROM teacher WHERE department = '电子工程系'
  4. )
  5. -- 合并两个集
  6. UNION
  7. SELECT * FROM teacher WHERE department = '电子工程系' AND profession NOT IN (
  8. SELECT profession FROM teacher WHERE department = '计算机系'
  9. );

ANY 表示至少一个 - DESC ( 降序 )

查询课程 **3-105** 且成绩 至少 高于 **3-245****score** 表。

  1. SELECT * FROM score WHERE c_no = '3-105';
  2. +------+-------+--------+
  3. | s_no | c_no | degree |
  4. +------+-------+--------+
  5. | 101 | 3-105 | 90 |
  6. | 102 | 3-105 | 91 |
  7. | 103 | 3-105 | 92 |
  8. | 104 | 3-105 | 89 |
  9. | 105 | 3-105 | 88 |
  10. | 109 | 3-105 | 76 |
  11. +------+-------+--------+
  12. SELECT * FROM score WHERE c_no = '3-245';
  13. +------+-------+--------+
  14. | s_no | c_no | degree |
  15. +------+-------+--------+
  16. | 103 | 3-245 | 86 |
  17. | 105 | 3-245 | 75 |
  18. | 109 | 3-245 | 68 |
  19. +------+-------+--------+
  20. -- ANY: 符合SQL语句中的任意条件。
  21. -- 也就是说,在 3-105 成绩中,只要有一个大于从 3-245 筛选出来的任意行就符合条件,
  22. -- 最后根据降序查询结果。
  23. SELECT * FROM score WHERE c_no = '3-105' AND degree > ANY(
  24. SELECT degree FROM score WHERE c_no = '3-245'
  25. ) ORDER BY degree DESC;
  26. +------+-------+--------+
  27. | s_no | c_no | degree |
  28. +------+-------+--------+
  29. | 103 | 3-105 | 92 |
  30. | 102 | 3-105 | 91 |
  31. | 101 | 3-105 | 90 |
  32. | 104 | 3-105 | 89 |
  33. | 105 | 3-105 | 88 |
  34. | 109 | 3-105 | 76 |
  35. +------+-------+--------+

表示所有的 ALL

查询课程 **3-105** 且成绩高于 **3-245****score** 表。

  1. -- 只需对上一道题稍作修改。
  2. -- ALL: 符合SQL语句中的所有条件。
  3. -- 也就是说,在 3-105 每一行成绩中,都要大于从 3-245 筛选出来全部行才算符合条件。
  4. SELECT * FROM score WHERE c_no = '3-105' AND degree > ALL(
  5. SELECT degree FROM score WHERE c_no = '3-245'
  6. );
  7. +------+-------+--------+
  8. | s_no | c_no | degree |
  9. +------+-------+--------+
  10. | 101 | 3-105 | 90 |
  11. | 102 | 3-105 | 91 |
  12. | 103 | 3-105 | 92 |
  13. | 104 | 3-105 | 89 |
  14. | 105 | 3-105 | 88 |
  15. +------+-------+--------+

复制表的数据作为条件查询

查询某课程成绩比该课程平均成绩低的 **score** 表。

  1. -- 查询平均分
  2. SELECT c_no, AVG(degree) FROM score GROUP BY c_no;
  3. +-------+-------------+
  4. | c_no | AVG(degree) |
  5. +-------+-------------+
  6. | 3-105 | 87.6667 |
  7. | 3-245 | 76.3333 |
  8. | 6-166 | 81.6667 |
  9. +-------+-------------+
  10. -- 查询 score
  11. SELECT degree FROM score;
  12. +--------+
  13. | degree |
  14. +--------+
  15. | 90 |
  16. | 91 |
  17. | 92 |
  18. | 86 |
  19. | 85 |
  20. | 89 |
  21. | 88 |
  22. | 75 |
  23. | 79 |
  24. | 76 |
  25. | 68 |
  26. | 81 |
  27. +--------+
  28. -- 将表 b 作用于表 a 中查询数据
  29. -- score a (b): 将表声明为 a (b),
  30. -- 如此就能用 a.c_no = b.c_no 作为条件执行查询了。
  31. SELECT * FROM score a WHERE degree < (
  32. (SELECT AVG(degree) FROM score b WHERE a.c_no = b.c_no)
  33. );
  34. +------+-------+--------+
  35. | s_no | c_no | degree |
  36. +------+-------+--------+
  37. | 105 | 3-245 | 75 |
  38. | 105 | 6-166 | 79 |
  39. | 109 | 3-105 | 76 |
  40. | 109 | 3-245 | 68 |
  41. | 109 | 6-166 | 81 |
  42. +------+-------+--------+

子查询 - 4

查询所有任课 ( 在 **course** 表里有课程 ) 教师的 **name****department**

  1. SELECT name, department FROM teacher WHERE no IN (SELECT t_no FROM course);
  2. +--------+-----------------+
  3. | name | department |
  4. +--------+-----------------+
  5. | 李诚 | 计算机系 |
  6. | 王萍 | 计算机系 |
  7. | 刘冰 | 电子工程系 |
  8. | 张旭 | 电子工程系 |
  9. +--------+-----------------+

条件加组筛选

查询 **student** 表中至少有 2 名男生的 **class**

  1. -- 查看学生表信息
  2. SELECT * FROM student;
  3. +-----+-----------+-----+------------+-------+
  4. | no | name | sex | birthday | class |
  5. +-----+-----------+-----+------------+-------+
  6. | 101 | 曾华 | | 1977-09-01 | 95033 |
  7. | 102 | 匡明 | | 1975-10-02 | 95031 |
  8. | 103 | 王丽 | | 1976-01-23 | 95033 |
  9. | 104 | 李军 | | 1976-02-20 | 95033 |
  10. | 105 | 王芳 | | 1975-02-10 | 95031 |
  11. | 106 | 陆军 | | 1974-06-03 | 95031 |
  12. | 107 | 王尼玛 | | 1976-02-20 | 95033 |
  13. | 108 | 张全蛋 | | 1975-02-10 | 95031 |
  14. | 109 | 赵铁柱 | | 1974-06-03 | 95031 |
  15. | 110 | 张飞 | | 1974-06-03 | 95038 |
  16. +-----+-----------+-----+------------+-------+
  17. -- 只查询性别为男,然后按 class 分组,并限制 class 行大于 1
  18. SELECT class FROM student WHERE sex = '男' GROUP BY class HAVING COUNT(*) > 1;
  19. +-------+
  20. | class |
  21. +-------+
  22. | 95033 |
  23. | 95031 |
  24. +-------+

NOTLIKE 模糊查询取反

查询 **student** 表中不姓 “王” 的同学记录。

  1. -- NOT: 取反
  2. -- LIKE: 模糊查询
  3. mysql> SELECT * FROM student WHERE name NOT LIKE '王%';
  4. +-----+-----------+-----+------------+-------+
  5. | no | name | sex | birthday | class |
  6. +-----+-----------+-----+------------+-------+
  7. | 101 | 曾华 | | 1977-09-01 | 95033 |
  8. | 102 | 匡明 | | 1975-10-02 | 95031 |
  9. | 104 | 李军 | | 1976-02-20 | 95033 |
  10. | 106 | 陆军 | | 1974-06-03 | 95031 |
  11. | 108 | 张全蛋 | | 1975-02-10 | 95031 |
  12. | 109 | 赵铁柱 | | 1974-06-03 | 95031 |
  13. | 110 | 张飞 | | 1974-06-03 | 95038 |
  14. +-----+-----------+-----+------------+-------+

YEAR 与 NOW 函数

查询 **student** 表中每个学生的姓名和年龄。

  1. -- 使用函数 YEAR(NOW()) 计算出当前年份,减去出生年份后得出年龄。
  2. SELECT name, YEAR(NOW()) - YEAR(birthday) as age FROM student;
  3. +-----------+------+
  4. | name | age |
  5. +-----------+------+
  6. | 曾华 | 42 |
  7. | 匡明 | 44 |
  8. | 王丽 | 43 |
  9. | 李军 | 43 |
  10. | 王芳 | 44 |
  11. | 陆军 | 45 |
  12. | 王尼玛 | 43 |
  13. | 张全蛋 | 44 |
  14. | 赵铁柱 | 45 |
  15. | 张飞 | 45 |
  16. +-----------+------+

MAX 与 MIN 函数

查询 **student** 表中最大和最小的 **birthday** 值。

  1. SELECT MAX(birthday), MIN(birthday) FROM student;
  2. +---------------+---------------+
  3. | MAX(birthday) | MIN(birthday) |
  4. +---------------+---------------+
  5. | 1977-09-01 | 1974-06-03 |
  6. +---------------+---------------+

多段排序

**class****birthday** 从大到小的顺序查询 **student** 表。

  1. SELECT * FROM student ORDER BY class DESC, birthday;
  2. +-----+-----------+-----+------------+-------+
  3. | no | name | sex | birthday | class |
  4. +-----+-----------+-----+------------+-------+
  5. | 110 | 张飞 | | 1974-06-03 | 95038 |
  6. | 103 | 王丽 | | 1976-01-23 | 95033 |
  7. | 104 | 李军 | | 1976-02-20 | 95033 |
  8. | 107 | 王尼玛 | | 1976-02-20 | 95033 |
  9. | 101 | 曾华 | | 1977-09-01 | 95033 |
  10. | 106 | 陆军 | | 1974-06-03 | 95031 |
  11. | 109 | 赵铁柱 | | 1974-06-03 | 95031 |
  12. | 105 | 王芳 | | 1975-02-10 | 95031 |
  13. | 108 | 张全蛋 | | 1975-02-10 | 95031 |
  14. | 102 | 匡明 | | 1975-10-02 | 95031 |
  15. +-----+-----------+-----+------------+-------+

子查询 - 5

查询 “男” 教师及其所上的课程。

  1. SELECT * FROM course WHERE t_no in (SELECT no FROM teacher WHERE sex = '男');
  2. +-------+--------------+------+
  3. | no | name | t_no |
  4. +-------+--------------+------+
  5. | 3-245 | 操作系统 | 804 |
  6. | 6-166 | 数字电路 | 856 |
  7. +-------+--------------+------+

MAX 函数与子查询

查询最高分同学的 **score** 表。

  1. -- 找出最高成绩(该查询只能有一个结果)
  2. SELECT MAX(degree) FROM score;
  3. -- 根据上面的条件筛选出所有最高成绩表,
  4. -- 该查询可能有多个结果,假设 degree 值多次符合条件。
  5. SELECT * FROM score WHERE degree = (SELECT MAX(degree) FROM score);
  6. +------+-------+--------+
  7. | s_no | c_no | degree |
  8. +------+-------+--------+
  9. | 103 | 3-105 | 92 |
  10. +------+-------+--------+

子查询 - 6

查询和 “李军” 同性别的所有同学 **name**

  1. -- 首先将李军的性别作为条件取出来
  2. SELECT sex FROM student WHERE name = '李军';
  3. +-----+
  4. | sex |
  5. +-----+
  6. | |
  7. +-----+
  8. -- 根据性别查询 name sex
  9. SELECT name, sex FROM student WHERE sex = (
  10. SELECT sex FROM student WHERE name = '李军'
  11. );
  12. +-----------+-----+
  13. | name | sex |
  14. +-----------+-----+
  15. | 曾华 | |
  16. | 匡明 | |
  17. | 李军 | |
  18. | 陆军 | |
  19. | 王尼玛 | |
  20. | 张全蛋 | |
  21. | 赵铁柱 | |
  22. | 张飞 | |
  23. +-----------+-----+

子查询 - 7

查询和 “李军” 同性别且同班的同学 **name**

  1. SELECT name, sex, class FROM student WHERE sex = (
  2. SELECT sex FROM student WHERE name = '李军'
  3. ) AND class = (
  4. SELECT class FROM student WHERE name = '李军'
  5. );
  6. +-----------+-----+-------+
  7. | name | sex | class |
  8. +-----------+-----+-------+
  9. | 曾华 | | 95033 |
  10. | 李军 | | 95033 |
  11. | 王尼玛 | | 95033 |
  12. +-----------+-----+-------+

子查询 - 8

查询所有选修 “计算机导论” 课程的 “男” 同学成绩表。

需要的 “计算机导论” 和性别为 “男” 的编号可以在 coursestudent 表中找到。

  1. SELECT * FROM score WHERE c_no = (
  2. SELECT no FROM course WHERE name = '计算机导论'
  3. ) AND s_no IN (
  4. SELECT no FROM student WHERE sex = '男'
  5. );
  6. +------+-------+--------+
  7. | s_no | c_no | degree |
  8. +------+-------+--------+
  9. | 101 | 3-105 | 90 |
  10. | 102 | 3-105 | 91 |
  11. | 104 | 3-105 | 89 |
  12. | 109 | 3-105 | 76 |
  13. +------+-------+--------+

按等级查询

建立一个 grade 表代表学生的成绩等级,并插入数据:

  1. CREATE TABLE grade (
  2. low INT(3),
  3. upp INT(3),
  4. grade char(1)
  5. );
  6. INSERT INTO grade VALUES (90, 100, 'A');
  7. INSERT INTO grade VALUES (80, 89, 'B');
  8. INSERT INTO grade VALUES (70, 79, 'C');
  9. INSERT INTO grade VALUES (60, 69, 'D');
  10. INSERT INTO grade VALUES (0, 59, 'E');
  11. SELECT * FROM grade;
  12. +------+------+-------+
  13. | low | upp | grade |
  14. +------+------+-------+
  15. | 90 | 100 | A |
  16. | 80 | 89 | B |
  17. | 70 | 79 | C |
  18. | 60 | 69 | D |
  19. | 0 | 59 | E |
  20. +------+------+-------+

查询所有学生的 **s_no****c_no****grade** 列。

思路是,使用区间 ( BETWEEN ) 查询,判断学生的成绩 ( degree ) 在 grade 表的 lowupp 之间。

  1. SELECT s_no, c_no, grade FROM score, grade
  2. WHERE degree BETWEEN low AND upp;
  3. +------+-------+-------+
  4. | s_no | c_no | grade |
  5. +------+-------+-------+
  6. | 101 | 3-105 | A |
  7. | 102 | 3-105 | A |
  8. | 103 | 3-105 | A |
  9. | 103 | 3-245 | B |
  10. | 103 | 6-166 | B |
  11. | 104 | 3-105 | B |
  12. | 105 | 3-105 | B |
  13. | 105 | 3-245 | C |
  14. | 105 | 6-166 | C |
  15. | 109 | 3-105 | C |
  16. | 109 | 3-245 | D |
  17. | 109 | 6-166 | B |
  18. +------+-------+-------+

连接查询

准备用于测试连接查询的数据:

  1. CREATE DATABASE testJoin;
  2. CREATE TABLE person (
  3. id INT,
  4. name VARCHAR(20),
  5. cardId INT
  6. );
  7. CREATE TABLE card (
  8. id INT,
  9. name VARCHAR(20)
  10. );
  11. INSERT INTO card VALUES (1, '饭卡'), (2, '建行卡'), (3, '农行卡'), (4, '工商卡'), (5, '邮政卡');
  12. SELECT * FROM card;
  13. +------+-----------+
  14. | id | name |
  15. +------+-----------+
  16. | 1 | 饭卡 |
  17. | 2 | 建行卡 |
  18. | 3 | 农行卡 |
  19. | 4 | 工商卡 |
  20. | 5 | 邮政卡 |
  21. +------+-----------+
  22. INSERT INTO person VALUES (1, '张三', 1), (2, '李四', 3), (3, '王五', 6);
  23. SELECT * FROM person;
  24. +------+--------+--------+
  25. | id | name | cardId |
  26. +------+--------+--------+
  27. | 1 | 张三 | 1 |
  28. | 2 | 李四 | 3 |
  29. | 3 | 王五 | 6 |
  30. +------+--------+--------+

分析两张表发现,person 表并没有为 cardId 字段设置一个在 card 表中对应的 id 外键。如果设置了的话,personcardId 字段值为 6 的行就插不进去,因为该 cardId 值在 card 表中并没有。

内连接

要查询这两张表中有关系的数据,可以使用 INNER JOIN ( 内连接 ) 将它们连接在一起。

  1. -- INNER JOIN: 表示为内连接,将两张表拼接在一起。
  2. -- on: 表示要执行某个条件。
  3. SELECT * FROM person INNER JOIN card on person.cardId = card.id;
  4. +------+--------+--------+------+-----------+
  5. | id | name | cardId | id | name |
  6. +------+--------+--------+------+-----------+
  7. | 1 | 张三 | 1 | 1 | 饭卡 |
  8. | 2 | 李四 | 3 | 3 | 农行卡 |
  9. +------+--------+--------+------+-----------+
  10. -- INNER 关键字省略掉,结果也是一样的。
  11. -- SELECT * FROM person JOIN card on person.cardId = card.id;

注意:card 的整张表被连接到了右边。

左外连接

完整显示左边的表 ( person ) ,右边的表如果符合条件就显示,不符合则补 NULL

  1. -- LEFT JOIN 也叫做 LEFT OUTER JOIN,用这两种方式的查询结果是一样的。
  2. SELECT * FROM person LEFT JOIN card on person.cardId = card.id;
  3. +------+--------+--------+------+-----------+
  4. | id | name | cardId | id | name |
  5. +------+--------+--------+------+-----------+
  6. | 1 | 张三 | 1 | 1 | 饭卡 |
  7. | 2 | 李四 | 3 | 3 | 农行卡 |
  8. | 3 | 王五 | 6 | NULL | NULL |
  9. +------+--------+--------+------+-----------+

右外链接

完整显示右边的表 ( card ) ,左边的表如果符合条件就显示,不符合则补 NULL

  1. SELECT * FROM person RIGHT JOIN card on person.cardId = card.id;
  2. +------+--------+--------+------+-----------+
  3. | id | name | cardId | id | name |
  4. +------+--------+--------+------+-----------+
  5. | 1 | 张三 | 1 | 1 | 饭卡 |
  6. | 2 | 李四 | 3 | 3 | 农行卡 |
  7. | NULL | NULL | NULL | 2 | 建行卡 |
  8. | NULL | NULL | NULL | 4 | 工商卡 |
  9. | NULL | NULL | NULL | 5 | 邮政卡 |
  10. +------+--------+--------+------+-----------+

全外链接

完整显示两张表的全部数据。

  1. -- MySQL 不支持这种语法的全外连接
  2. -- SELECT * FROM person FULL JOIN card on person.cardId = card.id;
  3. -- 出现错误:
  4. -- ERROR 1054 (42S22): Unknown column 'person.cardId' in 'on clause'
  5. -- MySQL全连接语法,使用 UNION 将两张表合并在一起。
  6. SELECT * FROM person LEFT JOIN card on person.cardId = card.id
  7. UNION
  8. SELECT * FROM person RIGHT JOIN card on person.cardId = card.id;
  9. +------+--------+--------+------+-----------+
  10. | id | name | cardId | id | name |
  11. +------+--------+--------+------+-----------+
  12. | 1 | 张三 | 1 | 1 | 饭卡 |
  13. | 2 | 李四 | 3 | 3 | 农行卡 |
  14. | 3 | 王五 | 6 | NULL | NULL |
  15. | NULL | NULL | NULL | 2 | 建行卡 |
  16. | NULL | NULL | NULL | 4 | 工商卡 |
  17. | NULL | NULL | NULL | 5 | 邮政卡 |
  18. +------+--------+--------+------+-----------+

事务

在 MySQL 中,事务其实是一个最小的不可分割的工作单元。事务能够保证一个业务的完整性

比如我们的银行转账:

  1. -- a -> -100
  2. UPDATE user set money = money - 100 WHERE name = 'a';
  3. -- b -> +100
  4. UPDATE user set money = money + 100 WHERE name = 'b';

在实际项目中,假设只有一条 SQL 语句执行成功,而另外一条执行失败了,就会出现数据前后不一致。

因此,在执行多条有关联 SQL 语句时,事务可能会要求这些 SQL 语句要么同时执行成功,要么就都执行失败。

如何控制事务 - COMMIT / ROLLBACK

在 MySQL 中,事务的自动提交状态默认是开启的。

  1. -- 查询事务的自动提交状态
  2. SELECT @@AUTOCOMMIT;
  3. +--------------+
  4. | @@AUTOCOMMIT |
  5. +--------------+
  6. | 1 |
  7. +--------------+

自动提交的作用:当我们执行一条 SQL 语句的时候,其产生的效果就会立即体现出来,且不能回滚

什么是回滚?举个例子:

  1. CREATE DATABASE bank;
  2. USE bank;
  3. CREATE TABLE user (
  4. id INT PRIMARY KEY,
  5. name VARCHAR(20),
  6. money INT
  7. );
  8. INSERT INTO user VALUES (1, 'a', 1000);
  9. SELECT * FROM user;
  10. +----+------+-------+
  11. | id | name | money |
  12. +----+------+-------+
  13. | 1 | a | 1000 |
  14. +----+------+-------+

可以看到,在执行插入语句后数据立刻生效,原因是 MySQL 中的事务自动将它提交到了数据库中。那么所谓回滚的意思就是,撤销执行过的所有 SQL 语句,使其回滚到最后一次提交数据时的状态。

在 MySQL 中使用 ROLLBACK 执行回滚:

  1. -- 回滚到最后一次提交
  2. ROLLBACK;
  3. SELECT * FROM user;
  4. +----+------+-------+
  5. | id | name | money |
  6. +----+------+-------+
  7. | 1 | a | 1000 |
  8. +----+------+-------+

由于所有执行过的 SQL 语句都已经被提交过了,所以数据并没有发生回滚。那如何让数据可以发生回滚?

  1. -- 关闭自动提交
  2. SET AUTOCOMMIT = 0;
  3. -- 查询自动提交状态
  4. SELECT @@AUTOCOMMIT;
  5. +--------------+
  6. | @@AUTOCOMMIT |
  7. +--------------+
  8. | 0 |
  9. +--------------+

将自动提交关闭后,测试数据回滚:

  1. INSERT INTO user VALUES (2, 'b', 1000);
  2. -- 关闭 AUTOCOMMIT 后,数据的变化是在一张虚拟的临时数据表中展示,
  3. -- 发生变化的数据并没有真正插入到数据表中。
  4. SELECT * FROM user;
  5. +----+------+-------+
  6. | id | name | money |
  7. +----+------+-------+
  8. | 1 | a | 1000 |
  9. | 2 | b | 1000 |
  10. +----+------+-------+
  11. -- 数据表中的真实数据其实还是:
  12. +----+------+-------+
  13. | id | name | money |
  14. +----+------+-------+
  15. | 1 | a | 1000 |
  16. +----+------+-------+
  17. -- 由于数据还没有真正提交,可以使用回滚
  18. ROLLBACK;
  19. -- 再次查询
  20. SELECT * FROM user;
  21. +----+------+-------+
  22. | id | name | money |
  23. +----+------+-------+
  24. | 1 | a | 1000 |
  25. +----+------+-------+

那如何将虚拟的数据真正提交到数据库中?使用 COMMIT :

  1. INSERT INTO user VALUES (2, 'b', 1000);
  2. -- 手动提交数据(持久性),
  3. -- 将数据真正提交到数据库中,执行后不能再回滚提交过的数据。
  4. COMMIT;
  5. -- 提交后测试回滚
  6. ROLLBACK;
  7. -- 再次查询(回滚无效了)
  8. SELECT * FROM user;
  9. +----+------+-------+
  10. | id | name | money |
  11. +----+------+-------+
  12. | 1 | a | 1000 |
  13. | 2 | b | 1000 |
  14. +----+------+-------+

总结

  1. 自动提交
    • 查看自动提交状态:SELECT @@AUTOCOMMIT
    • 设置自动提交状态:SET AUTOCOMMIT = 0
  2. 手动提交
    @@AUTOCOMMIT = 0 时,使用 COMMIT 命令提交事务。
  3. 事务回滚
    @@AUTOCOMMIT = 0 时,使用 ROLLBACK 命令回滚事务。

事务的实际应用,让我们再回到银行转账项目:

  1. -- 转账
  2. UPDATE user set money = money - 100 WHERE name = 'a';
  3. -- 到账
  4. UPDATE user set money = money + 100 WHERE name = 'b';
  5. SELECT * FROM user;
  6. +----+------+-------+
  7. | id | name | money |
  8. +----+------+-------+
  9. | 1 | a | 900 |
  10. | 2 | b | 1100 |
  11. +----+------+-------+

这时假设在转账时发生了意外,就可以使用 ROLLBACK 回滚到最后一次提交的状态:

  1. -- 假设转账发生了意外,需要回滚。
  2. ROLLBACK;
  3. SELECT * FROM user;
  4. +----+------+-------+
  5. | id | name | money |
  6. +----+------+-------+
  7. | 1 | a | 1000 |
  8. | 2 | b | 1000 |
  9. +----+------+-------+

这时我们又回到了发生意外之前的状态,也就是说,事务给我们提供了一个可以反悔的机会。假设数据没有发生意外,这时可以手动将数据真正提交到数据表中:COMMIT

手动开启事务 - BEGIN / START TRANSACTION

事务的默认提交被开启 ( @@AUTOCOMMIT = 1 ) 后,此时就不能使用事务回滚了。但是我们还可以手动开启一个事务处理事件,使其可以发生回滚:

  1. -- 使用 BEGIN 或者 START TRANSACTION 手动开启一个事务
  2. -- START TRANSACTION;
  3. BEGIN;
  4. UPDATE user set money = money - 100 WHERE name = 'a';
  5. UPDATE user set money = money + 100 WHERE name = 'b';
  6. -- 由于手动开启的事务没有开启自动提交,
  7. -- 此时发生变化的数据仍然是被保存在一张临时表中。
  8. SELECT * FROM user;
  9. +----+------+-------+
  10. | id | name | money |
  11. +----+------+-------+
  12. | 1 | a | 900 |
  13. | 2 | b | 1100 |
  14. +----+------+-------+
  15. -- 测试回滚
  16. ROLLBACK;
  17. SELECT * FROM user;
  18. +----+------+-------+
  19. | id | name | money |
  20. +----+------+-------+
  21. | 1 | a | 1000 |
  22. | 2 | b | 1000 |
  23. +----+------+-------+

仍然使用 COMMIT 提交数据,提交后无法再发生本次事务的回滚。

  1. BEGIN;
  2. UPDATE user set money = money - 100 WHERE name = 'a';
  3. UPDATE user set money = money + 100 WHERE name = 'b';
  4. SELECT * FROM user;
  5. +----+------+-------+
  6. | id | name | money |
  7. +----+------+-------+
  8. | 1 | a | 900 |
  9. | 2 | b | 1100 |
  10. +----+------+-------+
  11. -- 提交数据
  12. COMMIT;
  13. -- 测试回滚(无效,因为表的数据已经被提交)
  14. ROLLBACK;

事务的 ACID 特征与使用

事务的四大特征:

  • A 原子性:事务是最小的单位,不可以再分割;
  • C 一致性:要求同一事务中的 SQL 语句,必须保证同时成功或者失败;
  • I 隔离性:事务1 和 事务2 之间是具有隔离性的;
  • D 持久性:事务一旦结束 ( COMMIT ) ,就不可以再返回了 ( ROLLBACK ) 。

事务的隔离性

事务的隔离性可分为四种 ( 性能从低到高 )

  1. READ UNCOMMITTED ( 读取未提交 )
    如果有多个事务,那么任意事务都可以看见其他事务的未提交数据
  2. READ COMMITTED ( 读取已提交 )
    只能读取到其他事务已经提交的数据
  3. REPEATABLE READ ( 可被重复读 )
    如果有多个连接都开启了事务,那么事务之间不能共享数据记录,否则只能共享已提交的记录。
  4. SERIALIZABLE ( 串行化 )
    所有的事务都会按照固定顺序执行,执行完一个事务后再继续执行下一个事务的写入操作

查看当前数据库的默认隔离级别:

  1. -- MySQL 8.x, GLOBAL 表示系统级别,不加表示会话级别。
  2. SELECT @@GLOBAL.TRANSACTION_ISOLATION;
  3. SELECT @@TRANSACTION_ISOLATION;
  4. +--------------------------------+
  5. | @@GLOBAL.TRANSACTION_ISOLATION |
  6. +--------------------------------+
  7. | REPEATABLE-READ | -- MySQL的默认隔离级别,可以重复读。
  8. +--------------------------------+
  9. -- MySQL 5.x
  10. SELECT @@GLOBAL.TX_ISOLATION;
  11. SELECT @@TX_ISOLATION;

修改隔离级别:

  1. -- 设置系统隔离级别,LEVEL 后面表示要设置的隔离级别 (READ UNCOMMITTED)。
  2. SET GLOBAL TRANSACTION ISOLATION LEVEL READ UNCOMMITTED;
  3. -- 查询系统隔离级别,发现已经被修改。
  4. SELECT @@GLOBAL.TRANSACTION_ISOLATION;
  5. +--------------------------------+
  6. | @@GLOBAL.TRANSACTION_ISOLATION |
  7. +--------------------------------+
  8. | READ-UNCOMMITTED |
  9. +--------------------------------+

脏读

测试 READ UNCOMMITTED ( 读取未提交 ) 的隔离性:

  1. INSERT INTO user VALUES (3, '小明', 1000);
  2. INSERT INTO user VALUES (4, '淘宝店', 1000);
  3. SELECT * FROM user;
  4. +----+-----------+-------+
  5. | id | name | money |
  6. +----+-----------+-------+
  7. | 1 | a | 900 |
  8. | 2 | b | 1100 |
  9. | 3 | 小明 | 1000 |
  10. | 4 | 淘宝店 | 1000 |
  11. +----+-----------+-------+
  12. -- 开启一个事务操作数据
  13. -- 假设小明在淘宝店买了一双800块钱的鞋子:
  14. START TRANSACTION;
  15. UPDATE user SET money = money - 800 WHERE name = '小明';
  16. UPDATE user SET money = money + 800 WHERE name = '淘宝店';
  17. -- 然后淘宝店在另一方查询结果,发现钱已到账。
  18. SELECT * FROM user;
  19. +----+-----------+-------+
  20. | id | name | money |
  21. +----+-----------+-------+
  22. | 1 | a | 900 |
  23. | 2 | b | 1100 |
  24. | 3 | 小明 | 200 |
  25. | 4 | 淘宝店 | 1800 |
  26. +----+-----------+-------+

由于小明的转账是在新开启的事务上进行操作的,而该操作的结果是可以被其他事务(另一方的淘宝店)看见的,因此淘宝店的查询结果是正确的,淘宝店确认到账。但就在这时,如果小明在它所处的事务上又执行了 ROLLBACK 命令,会发生什么?

  1. -- 小明所处的事务
  2. ROLLBACK;
  3. -- 此时无论对方是谁,如果再去查询结果就会发现:
  4. SELECT * FROM user;
  5. +----+-----------+-------+
  6. | id | name | money |
  7. +----+-----------+-------+
  8. | 1 | a | 900 |
  9. | 2 | b | 1100 |
  10. | 3 | 小明 | 1000 |
  11. | 4 | 淘宝店 | 1000 |
  12. +----+-----------+-------+

这就是所谓的脏读,一个事务读取到另外一个事务还未提交的数据。这在实际开发中是不允许出现的。

读取已提交

把隔离级别设置为 READ COMMITTED

  1. SET GLOBAL TRANSACTION ISOLATION LEVEL READ COMMITTED;
  2. SELECT @@GLOBAL.TRANSACTION_ISOLATION;
  3. +--------------------------------+
  4. | @@GLOBAL.TRANSACTION_ISOLATION |
  5. +--------------------------------+
  6. | READ-COMMITTED |
  7. +--------------------------------+

这样,再有新的事务连接进来时,它们就只能查询到已经提交过的事务数据了。但是对于当前事务来说,它们看到的还是未提交的数据,例如:

  1. -- 正在操作数据事务(当前事务)
  2. START TRANSACTION;
  3. UPDATE user SET money = money - 800 WHERE name = '小明';
  4. UPDATE user SET money = money + 800 WHERE name = '淘宝店';
  5. -- 虽然隔离级别被设置为了 READ COMMITTED,但在当前事务中,
  6. -- 它看到的仍然是数据表中临时改变数据,而不是真正提交过的数据。
  7. SELECT * FROM user;
  8. +----+-----------+-------+
  9. | id | name | money |
  10. +----+-----------+-------+
  11. | 1 | a | 900 |
  12. | 2 | b | 1100 |
  13. | 3 | 小明 | 200 |
  14. | 4 | 淘宝店 | 1800 |
  15. +----+-----------+-------+
  16. -- 假设此时在远程开启了一个新事务,连接到数据库。
  17. $ mysql -u root -p12345612
  18. -- 此时远程连接查询到的数据只能是已经提交过的
  19. SELECT * FROM user;
  20. +----+-----------+-------+
  21. | id | name | money |
  22. +----+-----------+-------+
  23. | 1 | a | 900 |
  24. | 2 | b | 1100 |
  25. | 3 | 小明 | 1000 |
  26. | 4 | 淘宝店 | 1000 |
  27. +----+-----------+-------+

但是这样还有问题,那就是假设一个事务在操作数据时,其他事务干扰了这个事务的数据。例如:

  1. -- 小张在查询数据的时候发现:
  2. SELECT * FROM user;
  3. +----+-----------+-------+
  4. | id | name | money |
  5. +----+-----------+-------+
  6. | 1 | a | 900 |
  7. | 2 | b | 1100 |
  8. | 3 | 小明 | 200 |
  9. | 4 | 淘宝店 | 1800 |
  10. +----+-----------+-------+
  11. -- 在小张求表的 money 平均值之前,小王做了一个操作:
  12. START TRANSACTION;
  13. INSERT INTO user VALUES (5, 'c', 100);
  14. COMMIT;
  15. -- 此时表的真实数据是:
  16. SELECT * FROM user;
  17. +----+-----------+-------+
  18. | id | name | money |
  19. +----+-----------+-------+
  20. | 1 | a | 900 |
  21. | 2 | b | 1100 |
  22. | 3 | 小明 | 1000 |
  23. | 4 | 淘宝店 | 1000 |
  24. | 5 | c | 100 |
  25. +----+-----------+-------+
  26. -- 这时小张再求平均值的时候,就会出现计算不相符合的情况:
  27. SELECT AVG(money) FROM user;
  28. +------------+
  29. | AVG(money) |
  30. +------------+
  31. | 820.0000 |
  32. +------------+

虽然 READ COMMITTED 让我们只能读取到其他事务已经提交的数据,但还是会出现问题,就是在读取同一个表的数据时,可能会发生前后不一致的情况。_这被称为_不可重复读现象 ( READ COMMITTED )

幻读

将隔离级别设置为 REPEATABLE READ ( 可被重复读取 ) :

  1. SET GLOBAL TRANSACTION ISOLATION LEVEL REPEATABLE READ;
  2. SELECT @@GLOBAL.TRANSACTION_ISOLATION;
  3. +--------------------------------+
  4. | @@GLOBAL.TRANSACTION_ISOLATION |
  5. +--------------------------------+
  6. | REPEATABLE-READ |
  7. +--------------------------------+

测试 REPEATABLE READ ,假设在两个不同的连接上分别执行 START TRANSACTION :

  1. -- 小张 - 成都
  2. START TRANSACTION;
  3. INSERT INTO user VALUES (6, 'd', 1000);
  4. -- 小王 - 北京
  5. START TRANSACTION;
  6. -- 小张 - 成都
  7. COMMIT;

当前事务开启后,没提交之前,查询不到,提交后可以被查询到。但是,在提交之前其他事务被开启了,那么在这条事务线上,就不会查询到当前有操作事务的连接。相当于开辟出一条单独的线程。

无论小张是否执行过 COMMIT ,在小王这边,都不会查询到小张的事务记录,而是只会查询到自己所处事务的记录:

  1. SELECT * FROM user;
  2. +----+-----------+-------+
  3. | id | name | money |
  4. +----+-----------+-------+
  5. | 1 | a | 900 |
  6. | 2 | b | 1100 |
  7. | 3 | 小明 | 1000 |
  8. | 4 | 淘宝店 | 1000 |
  9. | 5 | c | 100 |
  10. +----+-----------+-------+

这是因为小王在此之前开启了一个新的事务 ( **START TRANSACTION** ) _,那么_在他的这条新事务的线上,跟其他事务是没有联系的,也就是说,此时如果其他事务正在操作数据,它是不知道的。

然而事实是,在真实的数据表中,小张已经插入了一条数据。但是小王此时并不知道,也插入了同一条数据,会发生什么呢?

  1. INSERT INTO user VALUES (6, 'd', 1000);
  2. -- ERROR 1062 (23000): Duplicate entry '6' for key 'PRIMARY'

报错了,操作被告知已存在主键为 6 的字段。这种现象也被称为幻读,一个事务提交的数据,不能被其他事务读取到

串行化

顾名思义,就是所有事务的写入操作全都是串行化的。什么意思?把隔离级别修改成 SERIALIZABLE :

  1. SET GLOBAL TRANSACTION ISOLATION LEVEL SERIALIZABLE;
  2. SELECT @@GLOBAL.TRANSACTION_ISOLATION;
  3. +--------------------------------+
  4. | @@GLOBAL.TRANSACTION_ISOLATION |
  5. +--------------------------------+
  6. | SERIALIZABLE |
  7. +--------------------------------+

还是拿小张和小王来举例:

  1. -- 小张 - 成都
  2. START TRANSACTION;
  3. -- 小王 - 北京
  4. START TRANSACTION;
  5. -- 开启事务之前先查询表,准备操作数据。
  6. SELECT * FROM user;
  7. +----+-----------+-------+
  8. | id | name | money |
  9. +----+-----------+-------+
  10. | 1 | a | 900 |
  11. | 2 | b | 1100 |
  12. | 3 | 小明 | 1000 |
  13. | 4 | 淘宝店 | 1000 |
  14. | 5 | c | 100 |
  15. | 6 | d | 1000 |
  16. +----+-----------+-------+
  17. -- 发现没有 7 号王小花,于是插入一条数据:
  18. INSERT INTO user VALUES (7, '王小花', 1000);

此时会发生什么呢?由于现在的隔离级别是 SERIALIZABLE ( 串行化 ) ,串行化的意思就是:假设把所有的事务都放在一个串行的队列中,那么所有的事务都会按照固定顺序执行,执行完一个事务后再继续执行下一个事务的写入操作 ( 这意味着队列中同时只能执行一个事务的写入操作 ) 。

根据这个解释,小王在插入数据时,会出现等待状态,直到小张执行 COMMIT 结束它所处的事务,或者出现等待超时。