数据完整性(Data Integrity)是指数据的精确性(Accuracy)和可靠性(Reliability)。它是防止数据库中存在不符合语义规定的数据和防止因错误信息的输入输出造成无效操作或错误信息而提出的。为了保证数据的完整性,SQL规范以约束的方式对表数据进行额外的条件限制。从以下四个方面考虑:
- 实体完整性(Entity Integrity):例如,同一个表中,不能存在两条完全相同无法区分的记录
- 域完整性(Domain Integrity):例如:年龄范围0-120,性别范围“男/女”;
- 引用完整性(Referential Integrity):例如:员工所在部门要在部门表中能找到该部门;
用户自定义完整性(User-defined Integrity):例如:用户名唯一、密码不能为空等。
约束分类
约束是表级的强制规定。可以在创建表时规定约束(通过 CREATE TABLE 语句),或者在表创建之后通过 ALTER TABLE 语句规定约束。
根据约束数据列的限制,约束可分为:
- 单列约束:每个约束只约束一列;
- 多列约束:每个约束可约束多列数据。
- 根据约束的作用范围,约束可分为:
- 列级约束:只能作用在一个列上,跟在列的定义后面;
- 表级约束:可以作用在多个列上,不与列一起,而是单独定义。
- 根据约束起的作用,约束可分为:
- NOT NULL:非空约束,规定某个字段不能为空;
- UNIQUE KEY:唯一约束,规定某个字段在整个表中是唯一的;
- PRIMARY KEY:主键(非空且唯一)约束;
- AUTO_INCREMENT:自增列约束;
- FOREIGN KEY:外键约束;
- CHECK:检查约束,MySQL5.7不支持但可以使用check约束,而没有任何效果;
- DEFAULT:默认值约束。
查看某个表已有的约束:
-- information_schema数据库名(系统库)
-- table_constraints表名称(专门存储各个表的约束)
SELECT * FROM information_schema.table_constraints
WHERE table_name = '表名称';
非空约束(NOT NULL)
默认所有的类型的值都可以是NULL,包括INT, FLOAT等数据类型。非空约束只能出现在表对象的列上,只能单独限定某个列非空,不能组合限定为NOT NULL。一个表中可以有很多列都分别限定为非空。空字符串(“”)不等于NULL,0也不等于NULL。
-- 建表时添加非空约束
CREATE TABLE emp(
id INT(10) NOT NULL,
NAME VARCHAR(20) NOT NULL,
sex CHAR NULL
);
-- 建表后修改非空约束
ALTER TABLE emp MODIFY sex VARCHAR(30) NOT NULL;
ALTER TABLE emp MODIFY sex VARCHAR(30);
-- 建表后删除非空约束
ALTER TABLE emp MODIFY sex VARCHAR(30) NULL; -- 去掉not null,相当于允许该字段为空
唯一性约束(UNIQUE KEY)
唯一性约束用来限制某个列的值不能重复。同一个表可以有多个唯一约束;唯一约束可以是某个列值的唯一,也可以是多个组合的值唯一;唯一性约束允许某列值为空;在创建唯一性约束时如果不给唯一性约束命令就默认和列名相同;MySQL会给唯一约束的列上默认创建一个唯一索引。
-- 建表时添加唯一约束
CREATE TABLE student(
sid int,
sname varchar(20),
tel char(11) UNIQUE,
cardid char(18) UNIQUE [KEY] -- 关键字KEY可以省略
);
CREATE TABLE USER(
id INT NOT NULL,
name VARCHAR(25),
password VARCHAR(16),
-- 使用表级约束语法
CONSTRAINT uk_name_pwd UNIQUE [KEY](name,password)
);
-- 建表后指定唯一约束
-- 字段列表中如果是一个字段,表示该列的值唯一。
-- 如果是两个或更多个字段,那么复合唯一,即多个字段的组合是唯一的
ALTER TABLE USER ADD UNIQUE [KEY](name,password);
ALTER TABLE USER ADD CONSTRAINT uk_name_pwd UNIQUE [KEY](name,password);
添加唯一行约束的列上也会自动创建唯一索引。删除唯一性约束只能通过删除唯一索引的方式删除。删除时需要指定唯一索引名。如果创建唯一约束时未指定名称,如果是单列,就默认和列名相同;如果是组合列,那么默认和( )中排在第一个的列名相同。也可以自定义唯一性约束名。
SELECT * FROM information_schema.table_constraints
WHERE table_name = '表名'; -- 查看都有哪些约束
-- 也可以通过 `show index from 表名称; `查看表的索引
ALTER TABLE USER DROP INDEX uk_name_pwd;
主键约束(PRIMARY KEY)
PRIMARY KEY用来唯一标识表中的一行记录。主键约束相当于唯一约束+非空约束。主键约束列不允许为空,也不允许出现空值。
- 一个表最多只能有一个主键约束,建立主键约束可以在列级别创建,也可以在表级别上创建;
- 主键约束对应着表中的一列或者多列(复合主键);
- 如果是多列组合的复合主键约束,则这些列都不允许为空值,且组合的值不允许重复;
- MySQL的主键名总是PRIMARY,就算自己命名了主键约束名也没用;
- 当创建主键约束时,系统默认会在所在的列或列组合上建立对应的主键索引(能根据主键查询的,就根据主键查询,效率更高)。如果删除主键约束了,主键约束对应的索引就自动删除了;
- 不要修改主键字段的值。因为主键是数据记录的唯一标识,如果修改了主键的值,就有可能会破坏数据的完整性。
```sql
— 建表时添加主键约束
create table temp(
name varchar(20) ); CREATE TABLE emp5(id int primary key, -- 列级约束
);id INT NOT NULL AUTO_INCREMENT,
name VARCHAR(20),
pwd VARCHAR(15),
CONSTRAINT emp5_id_pk PRIMARY KEY(id) -- 表级约束
— 建表后添加主键约束 ALTER TABLE emp5 ADD PRIMARY KEY(name,pwd);
— 删除主键约束: 不需要指定主键名,因为一个表只有一个主键,删除主键约束后,非空还存在。 ALTER TABLE emp5 DROP PRIMARY KEY;
<a name="ZCQsQ"></a>
# 自增列:AUTO_INCREMENT
`auto_increment`用于某个字段的值自增。
- 一个表最多只能有一个自增长列;
- 当需要产生唯一标识符或顺序值时,可设置自增长;
- 自增长列约束的列必须是键列(主键列,唯一键列);
- 自增约束的列的数据类型必须是整数类型;
- 如果自增列指定了 0 和 null,会在当前最大值的基础上自增;如果自增列手动指定了具体值,直接赋值为具体值。
```sql
-- 建表时添加自增约束
create table employee(
eid int primary key auto_increment,
ename varchar(20)
);
-- 建表后添加自增约束
create table employee(
eid int primary key,
ename varchar(20)
);
alter table employee modify eid int auto_increment;
-- 删除自增约束
alter table employee modify eid int; -- 去掉auto_increment相当于删除
在MySQL 5.7系统中,对于自增主键的分配规则是由InnoDB数据字典内部一个计数器来决定的,而该计数器只在内存中维护,并不会持久化到磁盘中。当数据库重启时,该计数器会被初始化。MySQL 8.0将自增主键的计数器持久化到Redo日志中。每次计数器发生改变,都会将其写入重做日志中。如果数据库重启,InnoDB会根据重做日志中的信息来初始化计数器的内存值。
外键约束(FOREIGN KEY)⭐️⭐️⭐️
外键约束用于限定某个表的某个字段的引用完整性。主表(父表):被引用的表。从表(子表):引用其他表的表。例如:员工表的员工所在部门这个字段的值要参考部门表,部门表是主表,员工表是从表。外键约束的特点如下:
- 从表的外键列,必须引用主表的主键或唯一约束的列。因为被依赖的值必须是唯一的;
- 在创建外键约束时,需要指定外键约束名,如果不给外键约束命名,默认名不是列名,而是自动产生一个外键名(例如 student_ibfk_1;)。
- 创建(CREATE)表时就指定外键约束的话,需先创建主表,再创建从表;
- 删表时,需先删从表(或先删除外键约束),再删除主表;
- 当主表的记录被从表参照时,主表的记录将不允许删除,如果要删除数据,需要先删除从表中依赖该记录的数据,然后才可以删除主表的数据;
- 在”从表”中指定外键约束,并且一个表可以建立多个外键约束;
- 从表的外键列与主表被参照的列名字可以不相同,但是数据类型必须一样,逻辑意义一致。如果类型不一样,创建子表时,就会出现错误
ERROR 1005 (HY000): Can't create table 'database.tablename'(errno: 150)
。 - 当创建外键约束时,系统默认会在所在的列上建立对应的普通索引。但是索引名是外键的约束名。(根据外键查询效率很高)
- 删除外键约束后,必须手动删除对应的索引。
```sql
— 建表时添加外键约束
create table dept(
dname varchar(50) — 部门名称 ); create table emp(-- 主表
did int primary key, -- 部门编号
deptid int, — 员工所在的部门 foreign key (deptid) references dept(did) — 在从表中指定外键约束 — emp表的deptid和和dept表的did的数据类型一致,意义都是表示部门的编号 );-- 从表
eid int primary key, -- 员工编号
ename varchar(5), -- 员工姓名
— 建表后添加外键约束 — 一般表与表的关联都是提前设计好的, 因此创建表时就会把外键约束定义好 — 如果需要修改表的设计(添加新的列, 增加新的关联关系)但未预先定义外键约束就需要修改表进行补充. — 格式: ALTER TABLE 从表名 ADD [CONSTRAINT 约束名] FOREIGN KEY (从表的字段) — REFERENCES 主表名(被引用字段) [on update xx][on delete xx];
alter table emp add foreign key (deptid) references dept(did);
<a name="nhyHt"></a>
## 常见问题
1. 失败:不是键列
```sql
create table dept(
did int , -- 部门编号
dname varchar(50) -- 部门名称
);
create table emp(
eid int primary key, -- 员工编号
ename varchar(5), -- 员工姓名
deptid int, -- 员工所在的部门
foreign key (deptid) references dept(did)
);
-- ERROR 1215 (HY000): Cannot add foreign key constraint 原因是dept的did不是键列
- 失败:数据类型不一致
```sql
create table dept(
dname varchar(50) — 部门名称 );did int primary key, -- 部门编号
create table emp(
eid int primary key, — 员工编号
ename varchar(5), — 员工姓名
deptid char, — 员工所在的部门
foreign key (deptid) references dept(did)
);
— ERROR 1215 (HY000): Cannot add foreign key constraint
— 原因是从表的deptid字段和主表的did字段的数据类型不一致,并且要它俩的逻辑意义一致
3. 成功:列个表字段名一样
```sql
create table dept(
did int primary key, -- 部门编号
dname varchar(50) -- 部门名称
);
create table emp(
eid int primary key, -- 员工编号
ename varchar(5), -- 员工姓名
did int, -- 员工所在的部门
foreign key (did) references dept(did)
-- emp表的deptid和和dept表的did的数据类型一致,意义都是表示部门的编号
-- 是否重名没问题,因为两个did在不同的表中
);
- 添加、删除、修改问题
```sql
create table dept(
dname varchar(50) — 部门名称 );did int primary key, -- 部门编号
create table emp(
eid int primary key, — 员工编号
ename varchar(5), — 员工姓名
deptid int, — 员工所在的部门
foreign key (deptid) references dept(did)
— emp表的deptid和和dept表的did的数据类型一致,意义都是表示部门的编号
);
insert into dept values(1001,’教学部’);
insert into dept values(1003, ‘财务部’);
— 添加从表记录成功, 在添加这条记录时要求部门表有1001部门
insert into emp values(1,’张三’,1001);
— 添加从表记录失败: 从表emp添加记录失败,因为主表dept没有1005部门
insert into emp values(2,’李四’,1005);
— ERROR 1452 (23000): Cannot add(添加) or update(修改) a child row:
— a foreign key constraint fails (atguigudb
.emp
, CONSTRAINT emp_ibfk_1
— FOREIGN KEY (deptid
) REFERENCES dept
(did
))
— 修改从表失败: 部门表did字段现在没有1002的值,所以员工表中不能修改员工所在部门deptid为1002
update emp set deptid = 1002 where eid = 1;
— ERROR 1452 (23000): Cannot add or update a child row(子表的记录):
— a foreign key constraint fails(外键约束失败) (atguigudb
.emp
,
— CONSTRAINT emp_ibfk_1
FOREIGN KEY (deptid
) REFERENCES dept
(did
))
— 修改主表失败: 部门表did的1001字段已经被emp引用了,所以部门表的1001字段就不能修改了。
update dept set did = 1002 where did = 1001;
— ERROR 1451 (23000): Cannot delete or update a parent row(父表的记录):
— a foreign key constraint fails (atguigudb
.emp
, CONSTRAINT emp_ibfk_1
— FOREIGN KEY (deptid
) REFERENCES dept
(did
))
— 修改主表成功 因为部门表的1003部门没有被emp表引用,所以可以修改 update dept set did = 1002 where did = 1003;
— 删除主表失败:因为部门表did的1001字段已经被emp引用了,
— 所以部门表的1001字段对应的记录就不能被删除
delete from dept where did=1001;
— ERROR 1451 (23000): Cannot delete or update a parent row(父表记录):
— a foreign key constraint fails (atguigudb
.emp
, CONSTRAINT emp_ibfk_1
— FOREIGN KEY (deptid
) REFERENCES dept
(did
))
总结:约束关系是针对双方的
- 添加了外键约束后,主表的修改和删除数据受约束;
- 添加了外键约束后,从表的添加和修改数据受约束;
- 在从表上建立外键,要求主表必须存在;
- 删除主表时,要求从表从表先删除,或将从表中外键引用该主表的关系先删除。
<a name="DtVY9"></a>
## 约束等级
一共有以下五种约束等级:
- Cascade方式:在父表上update/delete记录时,同步update/delete掉子表的匹配记录 ;
- Set null方式:在父表上update/delete记录时,将子表上匹配记录的列设为null,但是要注意子表的外键列不能为not null ;
- No action方式:如果子表中有匹配的记录,则不允许对父表对应候选键进行update/delete操作 ;
- Restrict方式:同no action, 都是立即检查外键约束;
- Set default方式:父表有变更时,子表将外键列设置成一个默认的值,但Innodb不能识别。
如果没有指定等级,就相当于Restrict方式。对于外键约束,最好是采用: ON UPDATE CASCADE ON DELETE RESTRICT 的方式。<br />(1)示例1:`on update cascade on delete set null`
```sql
create table dept(
did int primary key, -- 部门编号
dname varchar(50) -- 部门名称
);
create table emp(
eid int primary key, -- 员工编号
ename varchar(5), -- 员工姓名
deptid int, -- 员工所在的部门
-- 把修改操作设置为级联修改等级,把删除操作设置为set null等级
foreign key (deptid) references dept(did)
on update cascade on delete set null
);
insert into dept values(1001,'教学部');
insert into dept values(1002, '财务部');
insert into dept values(1003, '咨询部');
insert into emp values(1,'张三',1001); -- 在添加这条记录时,要求部门表有1001部门
insert into emp values(2,'李四',1001);
insert into emp values(3,'王五',1002);
-- 修改主表成功,从表也跟着修改,修改了主表被引用的字段1002为1004,
-- 从表的引用字段就跟着修改为1004了
update dept set did = 1004 where did = 1002;
-- 删除主表的记录成功,从表对应的字段的值被修改为null
delete from dept where did = 1001;
(2)示例2:on update set null on delete cascade
create table dept(
did int primary key, -- 部门编号
dname varchar(50) -- 部门名称
);
create table emp(
eid int primary key, -- 员工编号
ename varchar(5), -- 员工姓名
deptid int, -- 员工所在的部门
-- 把修改操作设置为set null等级,把删除操作设置为级联删除等级
foreign key (deptid) references dept(did)
on update set null on delete cascade
);
insert into dept values(1001,'教学部');
insert into dept values(1002, '财务部');
insert into dept values(1003, '咨询部');
insert into emp values(1,'张三',1001); -- 在添加这条记录时,要求部门表有1001部门
insert into emp values(2,'李四',1001);
insert into emp values(3,'王五',1002);
-- 修改主表,从表对应的字段设置为null
update dept set did = 1004 where did = 1002;
-- 删除主表的记录成功,主表的1001行被删除了,从表相应的记录也被删除了
delete from dept where did=1001;
(3)示例3:on update cascade on delete cascade
create table dept(
did int primary key, -- 部门编号
dname varchar(50) -- 部门名称
);
create table emp(
eid int primary key, -- 员工编号
ename varchar(5), -- 员工姓名
deptid int, -- 员工所在的部门
-- 把修改操作设置为级联修改等级,把删除操作也设置为级联删除等级
foreign key (deptid) references dept(did)
on update cascade on delete cascade
);
insert into dept values(1001,'教学部');
insert into dept values(1002, '财务部');
insert into dept values(1003, '咨询部');
insert into emp values(1,'张三',1001); -- 在添加这条记录时,要求部门表有1001部门
insert into emp values(2,'李四',1001);
insert into emp values(3,'王五',1002);
-- 修改主表,从表对应的字段自动修改
update dept set did = 1004 where did = 1002;
-- 删除主表的记录成功,主表的1001行被删除了,从表相应的记录也被删除了
delete from dept where did=1001;
删除外键约束
删除外键约束的流程如下:
第一步先查看约束名和删除外键约束
-- 查看某个表的约束名
SELECT * FROM information_schema.table_constraints WHERE table_name = '表名称';
ALTER TABLE 从表名 DROP FOREIGN KEY 外键约束名;
第二步查看索引名和删除索引。(注意,只能手动删除)
-- 查看某个表的索引名
SHOW INDEX FROM 表名称;
ALTER TABLE 从表名 DROP INDEX 索引名;
开发场景
问题1:如果两个表之间有关系(一对一、一对多),比如:员工表和部门表(一对多),它们之间是否一定要建外键约束?
答:不是的
问题2:建和不建外键约束有什么区别?
答:建外键约束,你的操作(创建表、删除表、添加、修改、删除)会受到限制,从语法层面受到限制。例如:在员工表中不可能添加一个员工信息,它的部门的值在部门表中找不到。
不建外键约束,你的操作(创建表、删除表、添加、修改、删除)不受限制,要保证数据的引用完整性,只能依靠程序员的自觉,或者是在程序中进行限定。例如:在员工表中,可以添加一个员工的信息,它的部门指定为一个完全不存在的部门。
问题3:那么建和不建外键约束和查询有没有关系?
答:没有。在 MySQL 里,外键约束是有成本的,需要消耗系统资源。对于大并发的 SQL 操作,有可能会不适合。比如大型网站的中央数据库,可能会因为外键约束的系统开销而变得非常慢。所以, MySQL 允许你不使用系统自带的外键约束,在应用层面完成检查数据一致性的逻辑。也就是说,即使不用外键约束,也要想办法通过应用层面的附加逻辑,来实现外键约束的功能,确保数据的一致性。
CHECK约束
检查某个字段的值是否符合xx要求,一般指的是值的范围。MySQL5.7 可以使用check约束,但check约束对数据验证没有任何作用。添加数据时,没有任何错误或警告。但是MySQL 8.0中可以使用check约束了。
create table employee(
eid int primary key,
ename varchar(5),
-- 或 sex char(2) check(sex in(‘男’,’女’))
gender char check ('男' or '女')
);
DEFAULT约束
DEFAULT
用于给某个字段/某列指定默认值,一旦设置默认值,在插入数据时,如果此字段没有显式赋值,则赋值为默认值。DEFAULT
约束一般不在唯一键和主键列上加。
-- 建表时添加DEFAULT约束--
create table employee(
eid int primary key,
ename varchar(20) not null,
gender char default '男',
tel char(11) not null default '' -- 默认是空字符串
);
insert into employee values(1,'汪飞','男','13700102535'); -- 成功
insert into employee(eid,ename) values(2,'天琪'); -- 成功
-- 如果tel有唯一性约束的话会报错,如果tel没有唯一性约束,可以添加成功
insert into employee(eid,ename) values(3,'二虎');
-- 建表后添加/修改DEFAULT约束
alter table 表名称 modify 字段名 数据类型 default 默认值;
alter table 表名称 modify 字段名 数据类型 default 默认值 not null; -- 保留not null约束
-- 修改gender字段增加默认值约束
alter table employee modify gender char default '男';
-- 给tel字段增加默认值约束,并保留非空约束
alter table employee modify tel char(11) default '' not null;
-- 删除DEFAULT约束--
alter table 表名称 modify 字段名 数据类型; -- 删除默认值约束,也不保留非空约束
alter table 表名称 modify 字段名 数据类型 not null; -- 删除默认值约束,保留非空约束
面试问题
问题1:为什么建表时,加 not null default ‘’ 或 default 0
答:不想让表中出现null值。
问题2:为什么不想要 null 的值
答:(1)null不好比较。null是一种特殊值,比较时只能用专门的is null
和is not null
来比较。碰到运算符,通常返回null
。
(2)效率不高。影响提高索引效果。因此,往往在建表时 not null default 或 default 0。
问题3:带AUTO_INCREMENT约束的字段值是从1开始的吗?
在MySQL中,AUTO_INCREMENT默认的初始值是1,每新增一条记录,字段值自动加1。设置自增属性(AUTO_INCREMENT)的时候,还可以指定第一条插入记录的自增字段的值,这样新插入的记录的自增字段值从初始值开始递增,如在表中插入第一条记录,同时指定id值为5,则以后插入的记录的id值就会从6开始往上增加。添加主键约束时,往往需要设置字段自动增加属性。
问题4、并不是每个表都可以任意选择存储引擎?
外键约束(FOREIGN KEY)不能跨引擎使用。MySQL支持多种存储引擎,每一个表都可以指定一个不同的存储引擎,需要注意的是:外键约束是用来保证数据的参照完整性的,如果表之间需要关联外键,却指定了不同的存储引擎,那么这些表之间是不能创建外键约束的。所以说,存储引擎的选择也不完全是随意的。