概览
数值-整数形：5
- 类型介绍
- 可选属性
数值-浮点类型：2
数值-定点类型：1
字符型：2
- char和varchar：2
- text类型：4
日期型
位类型
BLOB类型
小结

参考文章

一级分类	类型	类型举例
数值型	整数类型5	TINYINT、SMALLINT、MEDIUMINT、INT(或INTEGER)、BIGINT
	浮点类型2	FLOAT、DOUBLE
	定点数类型1	DECIMAL
文本型	文本字符串类型	CHAR、VARCHAR、TINYTEXT、TEXT、MEDIUMTEXT、LONGTEXT
	枚举类型	ENUM
	集合类型	SET
日期型	日期时间类型	YEAR、TIME、DATE、DATETIME、TIMESTAMP
其他	位类型	BIT
	二进制字符串类	BINARY、VARBINARY、TINYBLOB、BLOB、MEDIUMBLOB、LONGBLOB
	JSON类型	JSON对象、JSON数组
	空间数据类型	单值：GEOMETRY、POINT、LINESTRING、POLYGON；集合：MULTIPOINT、MULTILINESTRING、MULTIPOLYGON、GEOMETRYCOLLECTION

常见数据类型的属性

MySQL关键字	含义
NULL	数据列可包含NULL值
NOT NULL	数据列不允许包含NULL值
DEFAULT	默认值
PRIMARY KEY	主键
AUTO_INCREMENT	自动递增，适用于整数类型
UNSIGNED	无符号
CHARACTER SET name	指定一个字符集

数值-整数形：5

类型介绍

整数类型一共有 5 种，包括 TINYINT、SMALLINT、MEDIUMINT、INT（INTEGER）和 BIGINT。

类型	字节	有符号数取值范围	无符号数取值范围
tinyint	1	-128~127	0~255
smallint	2	-32768~32767	0~65535
mediumint	3	-8388608~8388607	0~16777215（1600多万）
int/integer	4	-2147483648~2147483647	0~4294967295（42亿）
bigint	8	-9223372036854775808~9223372036854775807	0~18446744073709551615

可选属性

UNSIGNED
UNSIGNED : 无符号类型（非负），所有的整数类型都有一个可选的属性UNSIGNED（无符号属性），无符号整数类型的最小取值为0。所以，如果需要在MySQL数据库中保存非负整数值时，可以将整数类型设置为无符号类型。int类型默认显示宽度为int(11)，无符号int类型默认显示宽度为int(10)。
如果不设置无符号还是有符号，默认是有符号，如果想设置无符号，需要添加unsigned关键字。注：SQLServer不能设置无符号类型。

alter table users_new add userdataid int unsigned;

~~ZEROFILL~~
ZEROFILL : 0填充，（如果某列是ZEROFILL，那么MySQL会自动为当前列添加UNSIGNED属性），如果指定了ZEROFILL只是表示不够M位时，用0在左边填充，如果超过M位，只要不超过数据存储范围即可。原来，在 int(M) 中，M的值跟 int(M) 所占多少存储空间并无任何关系。 int(3)、int(4)、int(8) 在磁盘上都是占用 4 bytes 的存储空间。
也就是说，int(M)，必须和UNSIGNED ZEROFILL一起使用才有意义。如果整数值超过M位，就按照实际位数存储，如果小于M位，前面用字符 0 进行填充。
M
M : 表示显示宽度，M的取值范围是(0, 255)，该值与存储大小或类型包含的值的范围无关，一般使用默认即可，较少使用。
例如，int(5)：当数据宽度小于5位的时候在数字前面需要用字符填满宽度。该项功能需要配合“ ZEROFILL ”使用，表示用“0”填满宽度，否则指定显示宽度无效。
Q：如果设置了显示宽度，那么插入的数据宽度超过显示宽度限制，会不会截断或插入失败？
A：不会对插入的数据有任何影响，还是按照类型的实际宽度进行保存，即显示宽度与类型可以存储的值范围无关。从MySQL 8.0.17开始，整数数据类型不推荐使用显示宽度属性。
整型数据类型可以在定义表结构时指定所需要的显示宽度，如果不指定，则系统为每一种类型指定默认的宽度值。

案例：userIds设置了M为10（通过设置该值的属性为zerofill），此时如果该int值的长度大于10，则正常显示，如果小于10，则前面补0。注：这玩意就是跟显示有关，跟int的存储和范围一点关系都没有，一般不用手动去设置。

数值-浮点类型：2

浮点数和定点数类型的特点是可以处理小数，你可以把整数看成小数的一个特例。因此，浮点数和定点数的使用场景，比整数大多了。
类型介绍
MySQL支持的浮点数类型，分别是 FLOAT、DOUBLE、REAL。

FLOAT 表示单精度浮点数；
DOUBLE 表示双精度浮点数；
~~REAL默认就是 DOUBLE。如果你把 SQL 模式设定为启用~~~~REAL_AS_FLOAT~~~~，那么MySQL就认为REAL是FLOAT。~~

问题1：FLOAT 和 DOUBLE 这两种数据类型的区别是啥？
FLOAT 占用字节数少，取值范围小；DOUBLE 占用字节数多，取值范围也大。
问题2：为什么浮点数类型的无符号数取值范围，只相当于有符号数取值范围的一半，也就是只相当于有符号数取值范围大于等于零的部分呢？
MySQL 存储浮点数的格式为：符号(S) 、尾数(M) 和阶码(E)。因此，无论有没有符号，MySQL 的浮点数都会存储表示符号的部分。因此，所谓的无符号数取值范围，其实就是有符号数取值范围大于等于零的部分。

精度说明
对于浮点类型，在MySQL中单精度值使用 4 个字节，双精度值使用 8 个字节。

MySQL允许使用如下这样非标准语法（其他数据库未必支持，因此如果涉及到数据迁移，则最好不要这么用）
- FLOAT(M,D)或DOUBLE(M,D) 。这里，M称为精度，D称为标度。(M，D)中：M=整数位+小数位，D=小数位。 D<=M<=255，0<=D<=30。例如，定义为FLOAT(5,2)的一个列可以显示为-999.99-999.99。如果超过这个范围会报错。
- FLOAT和DOUBLE类型在不指定(M,D)时，默认会按照实际的精度（由实际的硬件和操作系统决定）来显示，只要数值范围不超过即可。
- 从MySQL 8.0.17开始，FLOAT(M,D) 和DOUBLE(M,D)用法在官方文档中已经明确不推荐使用，将来可能被移除。另外，关于浮点型FLOAT和DOUBLE的UNSIGNED也不推荐使用了，将来也可能被移除。

2 数据类型 - 图5

浮点类型，也可以加 UNSIGNED ，但是不会改变数据范围，例如：FLOAT(3,2) UNSIGNED仍然只能表示0-9.99的范围。
不管是否显式设置了精度(M,D)，这里MySQL的处理方案如下：
- 如果存储时，整数部分超出了范围，MySQL就会报错，不允许存这样的值。
- 如果存储时，小数点部分若超出范围，就分以下情况：
  - 若四舍五入后，整数部分没有超出范围，则只警告，但能成功操作并四舍五入删除多余的小数位后保存。例如在FLOAT(5,2)列内插入999.009，近似结果是999.01。
  - 若四舍五入后，整数部分超出范围，则MySQL报错，并拒绝处理。如FLOAT(5,2)列内插入999.995和-999.995都会报错。

浮点数的精度误差
MySQL对浮点类型数据的存储方式上，会导致出现精度误差。MySQL 用4个字节存储 FLOAT 类型数据，用 8 个字节来存储 DOUBLE 类型数据。无论哪个，都是采用二进制的方式来进行存储的。
比如 9.625，用二进制来表达，就是 1001.101，或者表达成 1.001101×23。如果尾数不是 0 或 5（比如 9.624），你就无法用一个二进制数来精确表达。进而，就只好在取值允许的范围内进行四舍五入。在编程中，如果用到浮点数，要特别注意误差问题，因为浮点数是不准确的，所以我们要避免使用=来判断两个数是否相等。同时，在一些对精确度要求较高的项目中，千万不要使用浮点数而采用DECIMAL，不然会导致结果错误，甚至是造成不可挽回的损失。

数值-定点类型：1

MySQL中的定点数类型只有 DECIMAL 一种类型。

使用 DECIMAL(M,D) 的方式表示高精度小数。 | 数据类型 | 字节数 | 含义 | | —- | —- | —- | | DECIMAL(M,D),DEC,NUMERIC | M+2字节 | 有效范围由M和D决定 |

M被称为精度，D被称为标度。0<=M<=65，0<=D<=30，D<M。该值决定了DECIAML的有效范围：例如，定义DECIMAL（5,2）的类型，表示该列取值范围是-999.99~999.99
DECIMAL 的存储空间并不是固定的，由精度值M决定，总共占用的存储空间为M+2个字节。也就是说，在一些对精度要求不高的场景下，比起占用同样字节长度的定点数，浮点数表达的数值范围可以更大一些。
当DECIMAL类型不指定精度和标度时，其默认为DECIMAL(10,0)。当数据的精度超出了定点数类型的精度范围时，则MySQL同样会进行四舍五入处理。

定点数在MySQL内部是以字符串的形式进行存储，这就决定了它一定是精准的。
浮点数 vs 定点数
1. 浮点数相对于定点数的优点是在长度一定的情况下，浮点类型取值范围大，但是不精准，适用于需要取值范围大，又可以容忍微小误差的科学计算场景（比如计算化学、分子建模、流体动力学等）
2. 定点数类型取值范围相对小，但是精准，没有误差，适合于对精度要求极高的场景（比如涉及金额计算的场景）
  
  由于 DECIMAL 数据类型的精准性，在我们的项目中，除了极少数（比如商品编号）用到整数类型外，其他的数值都用的是 DECIMAL，原因就是这个项目所处的零售行业，要求精准，一分钱也不能差。

字符型：2

MySQL中，文本字符串总体上分为 CHAR 、 VARCHAR 、 TINYTEXT 、 TEXT 、 MEDIUMTEXT 、LONGTEXT、ENUM、SET 等类型。

char和varchar：2

CHAR和VARCHAR类型都可以存储比较短的字符串。

字符串(文本)类型	特点	长度	长度范围	占用的存储空间
CHAR(M)	固定长度	M	0 <= M <= 255	M个字节
VARCHAR(M)	可变长度	M	0 <= M <= 65535	(实际长度length + 1) 个字节

CHAR类型

CHAR(M) 类型一般需要预先定义字符串长度。如果不指定(M)，则表示长度默认是1个字符。
如果保存时，数据的实际长度比CHAR类型声明的长度小，则会在右侧填充空格以达到指定的长度。当MySQL检索CHAR类型的数据时，CHAR类型的字段会去除尾部的空格。
定义CHAR类型字段时，声明的字段长度即为CHAR类型字段所占的存储空间的字节数。

VARCHAR类型

VARCHAR(M) 定义时，必须指定长度M，否则报错。
字符：MySQL5.0版本以上，varchar(3)：指的是3字符，如”你是谁”可以存入，”你是谁啊”不可以存入。
- MySQL4.0版本以下，varchar(20)：指的是20字节，如果存放UTF8汉字时，只能存6个（每个汉字3字节）
字节：检索VARCHAR类型的字段数据时，会保留数据尾部的空格。VARCHAR类型的字段所占用的存储空间为字符串实际长度加1个字节。

补充 length()：单位是字节，utf8编码下，一个汉字三个字节，一个数字或字母一个字节。gbk编码下，一个汉字两个字节，一个数字或字母一个字节。
使用SHOW VARIABLES LIKE ‘%char%’命令查看当前数据库的编码格式。
char_length()：单位为字符，不管汉字还是数字或者是字母都算是一个字符。 SELECT LENGTH(‘张三丰’);//在utf-8编码下，长度为9 SELECT LENGTH(123); //在utf-8编码下，长度为3 SELECT CHAR_LENGTH(‘张三丰’); //长度为3 SELECT LENGTH(123); //长度为3

如何选择？

类型	特点	空间上	时间上	适用场景
CHAR(M)	固定长度	浪费存储空间	效率高	存储不大，速度要求高
VARCHAR(M)	可变长度	节省存储空间	效率低	非CHAR的情况

存储很短的信息。

比如门牌号码101，201……这样很短的信息应该用char，因为varchar还要占个byte用于存储信息长度，本来打算节约存储的，结果得不偿失。

固定长度的

比如使用uuid作为主键，那用char应该更合适。因为他固定长度，varchar动态根据长度的特性就消失了，而且还要占个长度信息。

十分频繁改变的列

因为varchar每次存储都要有额外的计算，得到长度等工作，如果一个非常频繁改变的，那就要有很多的精力用于计算，而这些对于char来说是不需要的。

具体存储引擎中的情况
- MyISAM数据存储引擎和数据列：最好使用固定长度(CHAR)的数据列代替可变长度(VARCHAR)的数据列。这样使得整个表静态化，从而使数据检索更快，用空间换时间。
- InnoDB存储引擎：建议使用VARCHAR类型。因为对于InnoDB数据表，内部的行存储格式并没有区分固定长度和可变长度列（所有数据行都使用指向数据列值的头指针），而且主要影响性能的因素是数据行使用的存储总量，由于char平均占用的空间多于varchar，所以除了简短并且固定长度的，其他考虑varchar。这样节省空间，对磁盘I/O和数据存储总量比较好。
- MEMORY存储引擎和数据列：MEMORY数据表目前都使用固定长度的数据行存储，因此无论使用CHAR或VARCHAR列都没有关系，两者都是作为CHAR类型处理的。
  text类型：4
  在MySQL中，TEXT用来保存文本类型的字符串，总共包含4种类型，分别为TINYTEXT、TEXT、MEDIUMTEXT 和 LONGTEXT 类型。在向TEXT类型的字段保存和查询数据时，系统自动按照实际长度存储，不需要预先定义长度。这一点和VARCHAR类型相同。

文本字符串类型	特点	长度	长度范围	占用的存储空间
TINYTEXT	小文本、可变长度	L	0 <= L <= 255	L + 2 个字节
TEXT	文本、可变长度	L	0 <= L <= 65535	L + 2 个字节
MEDIUMTEXT	中等文本、可变长度	L	0 <= L <= 16777215	L + 3 个字节
LONGTEXT	大文本、可变长度	L	0 <= L<= 4294967295（42亿，相当于4GB）	L + 4 个字节

由于实际存储的长度不确定，MySQL不允许 TEXT 类型的字段做主键。遇到这种情况，只能采用CHAR(M)，或者 VARCHAR(M)。
TEXT文本类型，可以存比较大的文本段，搜索速度稍慢，因此如果不是特别大的内容，建议使用CHAR， VARCHAR来代替。
TEXT类型不用加默认值，加了也没用。而且text和blob类型的数据删除后容易导致“空洞”，使得文件碎片比较多，所以频繁使用的表不建议包含TEXT类型字段，建议单独分出去，单独用一个表。
日期型
| 类型 | 字节 | 格式 | 范围 | 备注 | | —- | —- | —- | —- | —- | | YEAR | 1 | YYYY或YY | 1901~2155 | 只保存年 | | DATE | 3 | YYYY-MM-DD | 1000-01-01~9999-12-31 | 只保存日期 | | TIME | 3 | HH:MM:SS | -838:59:59~838:59:59 | 只保存时间 | | DATETIME | 8 | YYYY-MM-DD HH:MM:SS | 1000-01-01 00:00:00~9999-12-31 23:59:59 | 保存日期+时间，不受时区影响 | | TIMESTAMP | 4 | YYYY-MM-DD HH:MM:SS | 1970-01-01 00:00:00UTC~2038-01-19 03:14:07UTC | 保存日期+时间，受时区影响 |

每个时间类型有一个有效值范围和一个”零”值，当指定不合法的MySQL不能表示的值时使用”零”值。
使用CURRENT_DATE()、CURRENT_TIMESTAMP()、NOW()函数，会插入当前系统的日期。
TIMESTAMP和DATETIME的区别：
- TIMESTAMP存储空间比较小，表示的日期时间范围也比较小。
- 底层存储方式不同，TIMESTAMP底层存储的是毫秒值，距离1970-1-1 0:0:0 0毫秒的毫秒值。
- 两个日期比较大小或日期计算时，TIMESTAMP更方便、更快。
- TIMESTAMP和时区有关。TIMESTAMP会根据用户的时区不同，显示不同的结果。而DATETIME则只能反映出插入时当地的时区，其他时区的人查看数据必然会有误差的。
开发中经验
- 用得最多的日期时间类型，就是DATETIME。虽然 MySQL 也支持 YEAR（年）、 TIME（时间）、DATE（日期），以及 TIMESTAMP 类型，但是在实际项目中，尽量用 DATETIME 类型。因为这个数据类型包括了完整的日期和时间信息，取值范围也最大，使用起来比较方便。毕竟，如果日期时间信息分散在好几个字段，很不容易记，而且查询的时候，SQL 语句也会更加复杂。如果有跨海需求，可以用TIMESTAMP。
- 此外，一般存注册时间、商品发布时间等，不建议使用DATETIME存储，而是使用时间戳，因为DATETIME虽然直观，但不便于计算。

位类型

BIT类型中存储的是二进制值，类似010110。

二进制字符串类型	长度	长度范围	占用空间
BIT(M)	M	1 <= M <= 64	约为(M + 7)/8个字节

BIT类型，如果没有指定(M)，默认是1位。这个1位，表示只能存1位的二进制值。这里(M)是表示二进制的位数，位数最小值为1，最大值为64。

使用b+0查询数据时，可以直接查询出存储的十进制数据的值。

BLOB类型

BLOB是一个二进制大对象，可以容纳可变数量的数据。
需要注意的是，在实际工作中，往往不会在MySQL数据库中使用BLOB类型存储大对象数据，通常会将图片、音频和视频文件存储到服务器的磁盘上，并将图片、音频和视频的访问路径存储到MySQL中。

二进制字符串类型	值的长度	长度范围	占用空间
TINYBLOB	L	0 <= L <= 255	L + 1 个字节
BLOB	L	0 <= L <= 65535（相当于64KB）	L + 2 个字节
MEDIUMBLOB	L	0 <= L <= 16777215 （相当于16MB）	L + 3 个字节
LONGBLOB	L	0 <= L <= 4294967295（相当于4GB）	L + 4 个字节

小结

在定义数据类型时，如果确定是整数，就用INT；
如果是小数，一定用定点数类型DECIMAL(M,D)；
如果是日期与时间，就用DATETIME。

这样做的好处是，首先确保你的系统不会因为数据类型定义出错。不过，凡事都是有两面的，可靠性好，并不意味着高效。比如，TEXT 虽然使用方便，但是效率不如 CHAR(M) 和 VARCHAR(M)。

关于字符串的选择，建议参考如下阿里巴巴的《Java开发手册》规范：

任何字段如果为非负数，必须是 UNSIGNED
【强制】小数类型为 DECIMAL，禁止使用 FLOAT 和 DOUBLE。

说明：在存储的时候，FLOAT 和 DOUBLE 都存在精度损失的问题，很可能在比较值的时候，得到不正确的结果。
如果存储的数据范围超过 DECIMAL 的范围，建议将数据拆成整数和小数并分开存储。

【强制】如果存储的字符串长度几乎相等，使用 CHAR 定长字符串类型。
【强制】VARCHAR 是可变长字符串，不预先分配存储空间，长度不要超过 5000。如果存储长度大于此值，定义字段类型为 TEXT，独立出来一张表，用主键来对应，避免影响其它字段索引效率。

2 数据类型

概览