MySQL 中的反斜杠 - 图1

2021-06-18

在MySQL中有很多特殊符号都是相当恶心的,比如字符串中有单引号(’)、双引号(”)、反斜杠(\)等等,同学们可以先脑补一下可能会出现啥问题?

在我们平时操作SQL中,一不注意这些符号就会给你背上一口锅。

你还别不信,听叔一句劝,这里的水很深,有些东西,你把握不住…《潘嘎之交》好了,今天咱们就一起针对最膈应人的反斜杠(\),来看看都有哪些坑。

一、INSERT语句中有反斜杠(\)

1、实际测试

咱们用下面这些SQL来测试一下反斜杠(\)在INSERT语句中会是啥样?

  1. INSERT INTO `demo0526` (`id`, `text`) VALUES (null, 'D:\陈哈哈\加班');
  2. INSERT INTO `demo0526` (`id`, `text`) VALUES (null, 'D:\\陈哈哈\\加班');
  3. INSERT INTO `demo0526` (`id`, `text`) VALUES (null, 'D:\\\陈哈哈\\\加班');
  4. INSERT INTO `demo0526` (`id`, `text`) VALUES (null, 'D:\\\\陈哈哈\\\\加班');
  5. INSERT INTO `demo0526` (`id`, `text`) VALUES (null, 'D:\\\\\陈哈哈\\\\\加班');

插入后的结果:

  1. mysql> select * from demo0526;
  2. +----+-----------------------+
  3. | id | text |
  4. +----+-----------------------+
  5. | 1 | D:陈哈哈加班 |
  6. | 2 | D:\陈哈哈\加 |
  7. | 3 | D:\陈哈哈\加 |
  8. | 4 | D:\\陈哈哈\\加班 |
  9. | 5 | D:\\陈哈哈\\加班 |
  10. +----+-----------------------+
  11. 5 rows in set (0.00 sec)

我们发现结果如下:

当字符串中有1个反斜杠,插入后算0个。

当字符串中有2个反斜杠,插入后算1个。

当字符串中有3个反斜杠,插入后算1个。

当字符串中有4个反斜杠,插入后算2个。

当字符串中有5个反斜杠,插入后算2个。

2、是啥原理?

后来发现,原因其实很简单,在MySQL中,反斜杠在字符串中是属于转义字符,经过语法解析器解析时会进行一次转义,所以当我们insert反斜杠(\)字符时,如 insert “\” 在数据库中最终只会存储””,第一个反斜杠(\)被当做转义字符处理。

同理,像这种 D:\陈哈哈\加班 字符串,语法解析器解析到第三个反斜杠(\)时,又会把它当做下一个转义字符进行处理,因此D:\陈哈哈\加班入库后变成了D:\陈哈哈\加班。

所以我们在代码中处理插入语句碰到反斜杠时,注意\是否已经改成\,否则入库后字符串会不一致。

二、SELECT查询反斜杠(\)

1、实际测试

我们还是沿用上面的表数据,直接用like模糊匹配来测试一下。

  1. mysql> select * from demo0526;
  2. +----+-----------------------+
  3. | id | text |
  4. +----+-----------------------+
  5. | 1 | D:陈哈哈加班 |
  6. | 2 | D:\陈哈哈\加 |
  7. | 3 | D:\陈哈哈\加 |
  8. | 4 | D:\\陈哈哈\\加班 |
  9. | 5 | D:\\陈哈哈\\加班 |
  10. +----+-----------------------+

我们先用单个反斜杠和两个反斜杠看看能查到啥玩意儿

  1. mysql> SELECT * from demo0526 where text like '%\%';
  2. Empty set (0.00 sec)
  3. mysql> SELECT * from demo0526 where text like '%\\%';
  4. Empty set (0.00 sec)

啊!!我们用like ‘%%’、like ‘%\%’查询后发现都查不到数据,纳尼?上面的我白学了吗?

别着急,我会告诉你SELECT语句中四个反斜杠(\)代表一个么?呀,我赶快换成like ‘%\%’试一试。

  1. mysql> SELECT * from demo0526 where text like '%\\\\%';
  2. +----+-----------------------+
  3. | id | text |
  4. +----+-----------------------+
  5. | 2 | D:\陈哈哈\加 |
  6. | 3 | D:\陈哈哈\加 |
  7. | 4 | D:\\陈哈哈\\加班 |
  8. | 5 | D:\\陈哈哈\\加班 |
  9. +----+-----------------------+
  10. 4 rows in set (0.00 sec)

喔?那我如果查询表中带有两个反斜杠(\)的数据,岂不是要like八个。。。。别拦我,我看看tm是谁设计的这规则。

  1. mysql> SELECT * from demo0526 where text like '%\\\\\\\\%';
  2. +----+-----------------------+
  3. | id | text |
  4. +----+-----------------------+
  5. | 4 | D:\\陈哈哈\\加班 |
  6. | 5 | D:\\陈哈哈\\加班 |
  7. +----+-----------------------+
  8. 2 rows in set (0.00 sec)

2、又是啥原理?

原来在mysql的like语法中,like后边的字符串除了会在语法解析时转义一次外,还会在正则匹配时进行第二次的转义。因此如果期望最终匹配到””,就要反转义两次,也就是由”\”到”\”再到””。

如果是普通的精确查询(=),则无需第二次的正则转义,和INSERT语句一样。

  1. mysql> SELECT * from demo0526 where text = '\\\\';
  2. +----+------+
  3. | id | text |
  4. +----+------+
  5. | 7 | \\ |
  6. +----+------+
  7. 1 row in set (0.00 sec)

总结

好了,看到这里同学们有什么感受呢?是不是发现MySQL中还是存在很多不方便的语法,进步空间还很大呀~~

在日常工作中,也会经常碰到这种符号引发的问题,尤其是用户在界面填写的数据,建议要做相关限定,明确哪些符号不允许。

作者:陈哈哈
原文链接:https://blog.csdn.net/qq_3939…

参考

https://zhuanlan.zhihu.com/p/345047006