一般情况下,数据库设计要求满足三大范式。
范式设计得越详细,对某些实际操作可能会更好,但并非都有好处,需要结合项目的实际情况进行设定。
第一范式 1NF
核心思想:数据表中所有字段都是不可分割的原子值。即只要字段值还可以继续拆分,就不满足第一范式。
第二范式 2NF
核心思想:在满足第一范式的前提下,除主键列外其他列都必须完全依赖于主键列。
如果出现不完全依赖,只可能发生在联合主键的情况下:
-- 订单表CREATE TABLE myorder (product_id INT,customer_id INT,product_name VARCHAR(20),customer_name VARCHAR(20),PRIMARY KEY (product_id, customer_id));
实际上,在这张订单表中,product_name 只依赖于 product_id ,customer_name 只依赖于 customer_id 。也就是说,product_name 和 customer_id 是没用关系的,customer_name 和 product_id 也是没有关系的。这不满足第二范式。
CREATE TABLE myorder (order_id INT PRIMARY KEY,product_id INT,customer_id INT);CREATE TABLE product (id INT PRIMARY KEY,name VARCHAR(20));CREATE TABLE customer (id INT PRIMARY KEY,name VARCHAR(20));
拆分之后,myorder 表中的 product_id 和 customer_id 完全依赖于 order_id 主键,而 product 和 customer 表中的其他字段又完全依赖于主键,满足了第二范式的设计!
第三范式 3NF
核心思想:在满足第二范式的前提下,除了主键列之外,其他列之间不能有传递依赖(可直接理解成“依赖”)关系。
CREATE TABLE myorder (order_id INT PRIMARY KEY,product_id INT,customer_id INT,customer_phone VARCHAR(15));
表中的 customer_phone 有可能依赖于 order_id 、 customer_id 两列,也就不满足了第三范式的设计:其他列之间不能有传递依赖关系。
customer_phone 数据不能单独存在,一个 customer_phone 数据肯定有对应的 customer_id 或 order_id ,即 customer_phone 依赖于 order_id 或 customer_id ,在这个例子中,由于 customer_phone 和非主键字段 customer_id 可能存在依赖关系,因此不满足第三范式。
CREATE TABLE myorder (order_id INT PRIMARY KEY,product_id INT,customer_id INT);CREATE TABLE customer (id INT PRIMARY KEY,name VARCHAR(20),phone VARCHAR(15));
修改后就不存在其他列之间的传递依赖关系,其他列都只依赖于主键列,满足了第三范式的设计!
