JavaScript+正则.png正则表达式是用来描述字符模式的对象。它被用来在文本中执行模式匹配(pattern-matching)以及”查找-替换”(search-and-replace)的任务。

前端开发中,我们常常会在这些地方看到正则:

  • 验证手机号,邮件,身份证号等是否合法。
  • 删除字符串前后多余的空格。
  • 从浏览器的UserAgent信息中提取出当前是什么浏览器,以及浏览器的版本。来做一些兼容性处理。

正则表达式给人的感觉:很难读懂,也难写。谁知道下面2个正则是干嘛的吗😂

  • /<\/?[a-zA-Z]+(\s+[a-zA-Z]+=".*")*>/g
  • /^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$/ /^[a-zA-Z][a-zA-Z0-9_]{2,6}$/

为什么要学习正则?

正则表达式用简短的代码,能实现非常复杂的文本查找替换操作。用字符串的api来实现同样的功能,代码会复杂的多,代码量也会多的多。比如,验证手机号是否合法。我们假定,合法的手机号指:以1开头的11位数字。

用字符串的api,这么写:

  1. function validPhone(phone) {
  2. let isValid = false
  3. phone += ''
  4. if (phone.length === 11 && phone[0] === '1' && !isNaN(phone)) {
  5. isValid = true
  6. }
  7. return isValid
  8. }

用正则,一行代码搞定:

  1. /^1\d{10}$/.test(phone)

可见,熟练掌握正则表达式,能极大的提升开发文本的查找替换功能的开发效率。

例子

学习正则表达式的最好方法是从例子开始,理解例子之后再自己对例子进行修改。下面,我们就开始吧~

例子1: 精确匹配

查找文本中是否包含cat。代码实现如下:

  1. /cat/.test('I have a cat.') // 返回true
  2. /cat/.test('I have a dog.') // 返回 false

上面的代码中,/cat/ 创建了一个匹配 cat 的正则。有两种方式创建正则对象:

  1. /匹配模式/。 如 /cat/
  2. new RegExp(匹配模式字符串)。 如 new RegExp('cat')

这两种方式的不同点在于,方式2支持传入变量。

test 是正则对象上的方法,用来检索字符串中是否包含指定的值。返回 true 或 false。还有一个常见的正则方法 exec,用来检索字符串中指定的值。

字符串的splitsearchreplacematch方法支持传入正则。

例子2: 匹配一类字符:数字,字母,空格等

查找文本是否有数字。代码实现如下

  1. /\d/.test('3C') // true

常见字符类型的匹配方式如下:

  • .: 匹配一个任意字符。
  • \d: 匹配一个数字。
  • \D: 匹配一个非数字字符。
  • [a-z]: 匹配一个小写字母。
  • [A-Z]: 匹配一个大写字母。
  • [\u4e00-\u9fa5]: 匹配一个中文字。
  • \w: 匹配字母、数字、下划线。等价于[A-Za-z0-9_]。
  • \s: 匹配任何空白字符,包括空格、制表符、换页符等等。
  • \S: 匹配任何非空白字符。
  • \\: 匹配\。

例子3: 匹配指定范围内字符

查找文本中是否包含 ab12 中任意一个字符。代码实现如下:

  1. /[ab12]/.test('a') // true
  2. /[ab12]/.test('b') // true
  3. /[ab12]/.test('1') // true
  4. /[ab12]/.test('2') // true

正则表达式好难学!9个易懂的例子,轻松入门JavaScript正则 - 图2

[指定范围] 来匹配指定范围内字符。 用 [^指定范围] 来匹配不在指定范围内的字符。如:/[^a-z]/ 匹配非小写字母。

例子4: 匹配重复

查找文本中是否包含5个a。蛮干版,代码实现如下:

  1. /aaaaa/.test('aaaaa') // true

优雅版:

  1. /a{5}/.test('aaaaa') // true

正则表达式好难学!9个易懂的例子,轻松入门JavaScript正则 - 图3

查找文本中是否包含3个ab。代码实现如下:

  1. /(ab){3}/.test('ababab') // true

注意,上面的代码中,用括号包起来ab,把ab变成一个整体。不加括号,匹配的是abbb。

重复字符的匹配方式如下:

  • *: 匹配前面的子表达式零次或多次。
  • +: 匹配前面的子表达式一次或多次。
  • ?: 匹配前面的子表达式零次或一次。
  • {n}: 匹配前面的子表达式确定的 n 次。
  • {n,}: 匹配前面的子表达式至少 n 次。
  • {n,m}: 匹配前面的子表达式 n 到 m之间。

更多例子:

  1. /a\*/ // 匹配任意个a
  2. /https?/ // 匹配 http https
  3. /1\d{10}/ // 11位手机号

例子5: 匹配文本以…开始和以…结尾

查找文本是否以字母开头,以数字结尾。代码实现如下:

  1. /^[a-zA-Z].*\d$/.test('ab1') // true

正则表达式好难学!9个易懂的例子,轻松入门JavaScript正则 - 图4

^用来匹配输入字符串的开始位置。$用来匹配输入字符串的结束位置。

例子6: 匹配多种情况

查找文本是包含138或包含159。代码实现如下:

  1. /(138|159)/.test('138') // true
  2. /(138|159)/.test('159') // true

正则表达式好难学!9个易懂的例子,轻松入门JavaScript正则 - 图5

|用来匹配多种情况。注意,情况包含的字符数量超过一个,要用括号包起来。反例:

  1. /138|159/.test('138') // false
  2. /138|159/.test('13859') // true
  3. /138|159/.test('13159') // true

例子7: 匹配模式

查找文本中是否全部是字母。实现方法1:

  1. /^[a-zA-Z]*$/.test('abcABC') // true

方法2:

  1. /^[a-z]*$/i.test('abcABC') // true

方法2中的i是匹配模式。常见的匹配模式如下:

  • g : 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)
  • i : 执行对大小写不敏感的匹配。
  • m : 执行多行匹配。

一个正则可以有多个模式,表示对多个模式的叠加。如 /a/ig

例子8: 匹配的争夺:贪婪模式和非贪婪模式

匹配文本中的非空白字符和数字,要尽量多匹配数字。代码实现如下:

  1. /(\S+?)(\d*)/.exec('a123') // ["a123", "a", "123"]
  2. // 这种写法,会尽可能多的匹配非空白字符:/(\S+)(\d*)/.exec('a123') // ["a123", "a123", ""]

正则表达式好难学!9个易懂的例子,轻松入门JavaScript正则 - 图6

当正则表达式中包重复的限定符(*+,?, {n}, {n,}, {n,m})时,匹配模式是贪婪的:匹配尽可能多的字符。在重复的限定符后加?,会将匹配模式改成非贪婪的:匹配尽可能少的字符。

例子9: 文本替换

将文本中单词”cat”替换成”dog”。代码实现如下:

  1. 'I have a cat.'.replace(/cat/, 'dog') // 运行结果 I have a dog.

将文本中所有的单词”cat”替换成”dog”。代码实现如下:

  1. 'cat,cat,cat'.replace(/cat/g, 'dog') // 运行结果 dog,dog,dog

将第2个出现的”cat”替换成”dog”。代码实现如下:

  1. let appearNum = 0
  2. let res = 'cat,cat,cat'.replace(/cat/g, (matched) => {
  3. appearNum++
  4. if(appearNum === 2) {
  5. return 'dog'
  6. } else {
  7. return matched
  8. }
  9. })
  10. console.log(res) // 运行结果 cat,dog,cat

推荐工具

RegExr

正则测试工具。

Regulex

JavaScript 正则可视化工具。展示效果:
正则表达式好难学!9个易懂的例子,轻松入门JavaScript正则 - 图7

总结

熟练掌握正则表达式,能极大的提升开发文本的查找替换功能的开发效率。大家有必要去认真学一下。

本文介绍了正则的基础。正则博大精深,还有很多值得研究。

参考&推荐阅读