转自:阿里巴巴Java开发手册 转自链接:https://learnku.com/articles/25148

强制部分:

1. 不要使用 count(列名)或 count(常量)来替代 count(),count()是 SQL92 定义的 标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。

说明:count(*)会统计值为 NULL 的行,而 count(列名)不会统计此列为 NULL 值的行。

2. count(distinct col) 计算该列除 NULL 之外的不重复行数,注意 count(distinct col1, col2) 如果其中一列全为 NULL,那么即使另一列有不同的值,也返回为 0。

3. 当某一列的值全是 NULL 时,count(col)的返回结果为 0,但 sum(col)的返回结果为 NULL,因此使用 sum()时需注意 NPE 问题。

正例:可以使用如下方式来避免 sum 的 NPE(空指针异常) 问题:SELECT IF(ISNULL(SUM(g)),0,SUM(g)) FROM table;

4. 使用 ISNULL()来判断是否为 NULL 值。

说明:NULL 与任何值的直接比较都为 NULL。
1) NULL<>NULL 的返回结果是 NULL,而不是 false。
2) NULL=NULL 的返回结果是 NULL,而不是 true。
3) NULL<>1 的返回结果是 NULL,而不是 true。

5. 在代码中写分页查询逻辑时,若 count 为 0 应直接返回,避免执行后面的分页语句。

6. 不得使用外键与级联,一切外键概念必须在应用层解决。

说明:以学生和成绩的关系为例,学生表中的 student_id是主键,那么成绩表中的 student_id 则为外键。如果更新学生表中的 student_id,同时触发成绩表中的 student_id 更新,即为 级联更新。外键与级联更新适用于单机低并发,不适合分布式、高并发集群;级联更新是强阻 塞,存在数据库更新风暴的风险;外键影响数据库的插入速度。

7. 禁止使用存储过程,存储过程难以调试和扩展,更没有移植性。

8. 数据订正(特别是删除、修改记录操作)时,要先 select,避免出现误删除,确认 无误才能执行更新语句。

9. 严禁使用 SELECT * 查询字段

说明:要什么 SELECT 什么,不能多,否则可能导致覆盖索引失效,消耗更多的 CPU 和 IO 以网络带宽资源

10. 必须避免数据类型隐式转换

说明:在 MySQL 中,数据会存在隐式转换,当该字段发生转换时,索引会造成失效。

11. 禁止使用带有数据值却不带有字段键名的 INSERT 操作

说明:这是一种错误的做法,对于表的改动后会造成比较大的影响。
正例:INSERT INTO user (username,age) VALUES (‘alicfeng’,23);
反例:INSERT INTO user VALUES (‘alicfeng’,23);

12. 尽可能使用 IN 代替 OR 语句

13. 禁止使用 ORDER BY RAND() 随机排序语句

说明:会把表中所有符合条件的数据装载到内存中,然后在内存中对所有数据根据随机生成的值进行排序,并且可能会对每一行都生成一个随机值,如果满足条件的数据集非常大,就会消耗大量的 CPU 和 IO 及内存资源。

14. IN 语句参数的个数尽量控制在 1000 以内

15. 注意 LIMIT 分页查询效率,LIMIT 越大效率越低

说明:在使用 LIMIT 做分页时,更改巧妙地处理查询,譬如使用 S1 替换成 S2,将有效地提高查询的效率。

  1. # S1
  2. SELECT `username` FROM `user` LIMIT 10000,20;
  3. # S2
  4. SELECT `username` FROM `user` WHERE id>10000 LIMIT 20;

16. 尽可能使用 EXIST|NOT EXIST 替代 IN | NOT IN

17. 禁止一条语句同时对多个表进行写操作

推荐部分:

1. 如果有国际化需要,所有的字符存储与表示,均以 utf-8 编码,注意字符统计函数 的区别。

说明:
SELECT LENGTH(“轻松工作”); 返回为 12
SELECT CHARACTER_LENGTH(“轻松工作”); 返回为 4
如果需要存储表情,那么选择 utf8mb4 来进行存储,注意它与 utf-8 编码的区别。

2. 编写 SQL 语句必须全部为大写,每个词必只允许只有一个空格符

说明:编写规范,必须统一并遵循。

3. 大批量写操作尽可能合理地分批次处理

说明:大批量的操作应当合理平均分批次处理,防止死锁影响业务,同时尽量将跑批这种大操作至于凌晨操作。

4. 使用事务尽量简单化,同时控制事务执行的时间

说明:时间长会导致长时间锁表,造成死锁,进而影响业务。