一、正则两种创建方式的区别

  1. // 构造函数因为传递的是字符串,\需要写两个才代表斜杠
  2. let reg = /\d+/g;
  3. reg = new RegExp("\\d+","g");
  4. // 正则表达是中的部分内容是变量存储的值
  5. // 1.两个斜杠中间包起来的都是元字符(如果正则中要包含某个变量的值,则不能使用字面量方式创建)
  6. let type = "zhufeng";
  7. reg = /^@"+type+"@$/;
  8. console.log(reg.test("@zhufeng@")); // false
  9. console.log(reg.test('@"""typeeeee"@')); // true
  10. // 2.这种情况只能使用构造函数方式(因为它传递的规则是字符串,只有这样才能进行字符串拼接)
  11. reg = new RegExp("^@"+type+"@$");
  12. console.log(reg.test("@zhufeng@")); // true

二、正则的捕获

实现正则捕获的办法

  • 正则 RegExp.prototype 上的方法
    • exec
    • test
  • 字符串 String.prototype 上支持正则表达式处理的方法
    • replace
    • match
    • splite
    • …….
  1. let str = "zhufeng2019yangfan2020qihang2021";
  2. let reg = /\d+/;
  3. /*
  4. * 基于 exec 实现正则的捕获
  5. * 1.捕获到的结果是 null 或者一个数组
  6. * 第一项:本次捕获到的内容
  7. * 其余项:对应小分组本次单独捕获的内容
  8. * index:当前捕获内容在字符串中的起始索引
  9. * input:原始字符串
  10. * 2.每执行一次 exec,只能捕获到一个符合正则规则的,但是默认情况下,我们执行一百遍,获取的结果永远
  11. 都是第一个匹配到的,其余的捕获不到
  12. * =>“正则捕获的懒惰性”:默认只捕获第一个
  13. */
  14. console.log(reg.exec(str)); // ["2019", index: 7, input: "zhufeng2019yangfan2020qihang2021"]
  15. console.log(reg.exec(str)); // ["2019"...]
  16. // 实现正则捕获的前提是:当前正则要和字符串匹配,如果不匹配捕获的结果是 null
  17. let reg = /^\d+$/;
  18. console.log(reg.test(str)); // false
  19. console.log(reg.exec(str)); // null

1. 懒惰性的解决办法

  1. let str = "zhufeng2019yangfan2020qihang2021";
  2. /*
  3. * reg.lastIndex:当前正则下一次匹配的起始索引位置
  4. * 懒惰性捕获的原因:默认情况下 lastIndex 的值不会被修改,每一次都是从字符串开始位置查找,所以找到
  5. 的永远只是第一个
  6. * 解决办法:全局修饰符 g
  7. */
  8. // let reg = /\d+/;
  9. // console.log(reg.lastIndex); // 0 下面匹配捕获是从STR索引零的位置开始找
  10. // console.log(reg.exec(str));
  11. // console.log(reg.lastIndex); // 0 第一次匹配捕获完成,lastIndex 没有改变,所以下一次 exec 依然是从字符串最开始找,找到的永远是第一个匹配到的
  12. // let reg = /\d+/g;
  13. // console.log(reg.exec(str)); // ["2019"...]
  14. // console.log(reg.lastIndex); // 11 设置全局匹配修饰符 g 后,第一次匹配完,lastIndex 会自己修改
  15. // console.log(reg.exec(str)); // ["2020"...]
  16. // console.log(reg.lastIndex); // 22
  17. // console.log(reg.exec(str)); // ["2021"...]
  18. // console.log(reg.lastIndex); // 32
  19. // console.log(reg.exec(str)); // null 当全部捕获后,再次捕获的结果是 null,但是 lastIndex 又回归了初始值零,再次捕获又从第一个开始了...
  20. // console.log(reg.lastIndex); // 0
  21. // console.log(reg.exec(str)); // ["2019"...]
  22. // let reg = /\d+/g;
  23. // if (reg.test(str)) {
  24. // 验证一下:只有正则和字符串匹配我们在捕获
  25. // console.log(reg.lastIndex); // 11 基于 TEST 匹配验证后,LASTINDEX 已经被修改为第一次匹配后的结果,所以下一次捕获不再从头开始了
  26. // console.log(reg.exec(str)); // ["2020"...]
  27. // }
  28. // 需求:编写一个方法 execAll,执行一次可以把所有匹配的结果捕获到(前提正则一定要设置全局修饰符g)
  29. ~ function () {
  30. function execAll(str = "") {
  31. // str:要匹配的字符串
  32. // this:RegExp 的实例(当前操作的正则)
  33. // 进来后的第一件事,是验证当前正则是否设置了 G,不设置则不能在进行循环捕获了,否则会导致死循环
  34. if (!this.global) return this.exec(str);
  35. // ARY 存储最后所有捕获的信息 RES 存储每一次捕获的内容(数组)
  36. let ary = [],
  37. res = this.exec(str);
  38. while (res) {
  39. // 把每一次捕获的内容RES[0]存放到数组中
  40. ary.push(res[0]);
  41. // 只要捕获的内容不为 NULL,则继续捕获下去
  42. res = this.exec(str);
  43. }
  44. return ary.length === 0 ? null : ary;
  45. }
  46. RegExp.prototype.execAll = execAll;
  47. }();
  48. let reg = /\d+/g;
  49. console.log(reg.execAll("珠峰2019@2020培训"));
  50. // 字符串中的 MATCH 方法,可以在执行一次的情况下,捕获到所有匹配的数据(前提:正则也得设置 G 才可以)
  51. console.log("珠峰2019@2020培训".match(reg));

2. 正则的分组捕获

  1. // 身份证号码
  2. let str = "130828199012040112";
  3. let reg = /^(\d{6})(\d{4})(\d{2})(\d{2})\d{2}(\d)(?:\d|X)$/;
  4. console.log(reg.exec(str));
  5. console.log(str.match(reg));
  6. // ["130828199012040112", "130828", "1990", "12", "04", "1", index: 0, input: "130828199012040112"]
  7. // 第一项:大正则匹配的结果
  8. // 其余项:每一个小分组单独匹配捕获的结果
  9. // 如果设置了分组(改变优先级),但是捕获的时候不需要单独捕获,可以基于?:来处理
  1. // 既要捕获到{数字},也想单独的把数字也获取到,例如:第一次找到 {0} 还需要单独获取0
  2. let str = "{0}年{1}月{2}日";
  3. /*
  4. // 不设置 g 只匹配一次,exec 和 match 获取的结果一致(既有大正则匹配的信息,也有小分组匹配的信息)
  5. let reg = /\{(\d+)\}/;
  6. console.log(reg.exec(str));
  7. console.log(str.match(reg));
  8. // ["{0}", "0",...]
  9. */
  10. let reg = /\{(\d+)\}/g;
  11. console.log(str.match(reg)); // ["{0}", "{1}", "{2}"] 多次匹配的情况下,match只能把大正则匹配的
  12. // 内容获取到,小分组匹配的信息无法获取
  13. let aryBig = [],
  14. arySmall = [],
  15. res = reg.exec(str);
  16. while (res ){
  17. let [big,small] = res;
  18. aryBig.push(big);
  19. arySmall.push(small);
  20. res = reg.exec(str);
  21. }
  22. console.log(aryBig, arySmall); // ["{0}", "{1}", "{2}"] ["0", "1", "2"]
  1. // 分组的第三个作用:“分组引用”
  2. let str = "book"; // "good"、"look"、"moon"、"foot"...
  3. let reg = /^[a-zA-Z]([a-zA-Z])\1[a-zA-Z]$/; // 分组引用就是通过“\数字”让其代表和对应分组出现一模一样的内容
  4. console.log(reg.test("book")); // true
  5. console.log(reg.test("deep")); // true
  6. console.log(reg.test("some")); // false

三、正则捕获的贪婪性

  1. let str = "珠峰2019@2020培训";
  2. // 正则捕获的贪婪性:默认情况下,正则捕获的时候,是按照当前正则所匹配的最长结果来获取的
  3. let reg = /\d+/g;
  4. console.log(str.match(reg)); // ["2019","2020"]
  5. // 在量词元字符后面设置?:取消捕获时候的贪婪性(按照正则匹配的最短结果来获取)
  6. reg = /\d+?/g;
  7. console.log(str.match(reg)); // ["2", "0", "1", "9", "2", "0", "2", "0"]

问号在正则中的五大作用:

  • 问号左边是非量词元字符:本身代表量词元字符,出现零到一次
  • 问号左边是量词元字符:取消捕获时候的贪婪性
  • (?:) 只匹配不捕获
  • (?=) 正向预查
  • (?!) 负向预查

其它正则捕获的方法

  1. test也能捕获(本意是匹配) ```javascript let str = “{0}年{1}月{2}日”; let reg = /{(\d+)}/g; console.log(reg.test(str)); // true console.log(RegExp.$1); // “0”

console.log(reg.test(str)); // true console.log(RegExp.$1); // “1”

console.log(reg.test(str)); // true console.log(RegExp.$1); // “2”

console.log(reg.test(str)); // false console.log(RegExp.$1); // “2” 存储的是上次捕获的结果

// RegExp.$1~RegExp.$9:获取当前本次正则匹配后,第一个到第九个分组的信息

  1. 2. replace 字符串中实现替换的方法(一般都是伴随正则一起使用的)
  2. ```javascript
  3. let str = "zhufeng@2019|zhufeng@2020";
  4. // 把 "zhufeng" 替换成"珠峰"
  5. // 1.不用正则,执行一次只能替换一个
  6. /*
  7. str = str.replace("zhufeng","珠峰").replace("zhufeng","珠峰");
  8. console.log(str);
  9. */
  10. // 2.使用正则会简单一点
  11. str = str.replace(/zhufeng/g,"珠峰");
  12. console.log(str);
  1. let str = "zhufeng@2019|zhufeng@2020";
  2. // 把 "zhufeng" 替换为 "zhufengpeixun"
  3. // str=str.replace("zhufeng","zhufengpeixun").replace("zhufeng","zhufengpeixun");
  4. // "zhufengpeixunpeixun@2019|zhufeng@2020" 每一次替换都是从字符串第一个位置开始找的(类似于正则捕获的懒惰性)
  5. // 基于正则 g 可以实现
  6. str = str.replace(/zhufeng/g,"zhufengpeixun");

案例:把时间字符串进行处理

  1. let time = "2019-08-13";
  2. // 变为"2019年08月13日"
  3. let reg = /^(\d{4})-(\d{1,2})-(\d{1,2})$/;
  4. // 这样可以实现
  5. // time = time.replace(reg,"$1年$2月$3日");
  6. // console.log(time); // 2019年08月13日
  7. // 还可以这样处理 [str].replace([reg],[function])
  8. // 1.首先拿 REG 和 TIME 进行匹配捕获,能匹配到几次就会把传递的函数执行几次(而且是匹配一次就执行一次)
  9. // 2.不仅把方法执行,而且 REPLACE 还给方法传递了实参信息(和 exec 捕获的内容一致的信息:大正则匹配内容,小分组匹配的信息....)
  10. // 3.在函数中我们返回的是啥,就把当前大正则匹配的内容替换成啥
  11. /*
  12. time = time.replace(reg,(big,$1,$2,$3)=>{
  13. // 这里的$1~$3是我们自己设置的变量
  14. console.log(big,$1,$2,$3);
  15. });
  16. */
  17. time = time.replace(reg,(...arg) => {
  18. let [,$1,$2,$3]=arg;
  19. $2.length < 2 ? $2 = "0" + $2:null;
  20. $3.length < 2 ? $3 = "0" + $3:null;
  21. return $1 + "年" + $ 2+ "月" + $3 + "日";
  22. });

案例:单词首字母大写

  1. let str = "good good study,day day up!";
  2. let reg = /\b([a-zA-Z])[a-zA-Z]*\b/g;
  3. // 函数被执行了六次,每一次都把正则匹配信息传递给函数
  4. // 每一次ARG:["good","g"] ["good","g"] ["study","s"]...
  5. str = str.replace(reg,(...arg)=>{
  6. let [content,$1]=arg;
  7. $1 = $1.toUpperCase();
  8. content = content.substring(1);
  9. return $1 + content;
  10. });
  11. console.log(str); // "Good Good Study,Day Day Up!"

案例:验证一个字符串中那个字母出现的次数最多,多少次?

  1. // 去重
  2. let str = "zhufengpeixunzhoulaoshi";
  3. let obj = {};
  4. [].forEach.call(str, char => {
  5. if (typeof obj[char] !== "undefined") {
  6. obj[char]++;
  7. return;
  8. }
  9. obj[char] = 1;
  10. });
  11. let max = 1,
  12. res = [];
  13. for (let key in obj) {
  14. let item = obj[key];
  15. item > max ? max = item : null;
  16. }
  17. for (let key in obj) {
  18. let item = obj[key];
  19. if (item === max) {
  20. res.push(key);
  21. }
  22. }
  23. console.log(`出现次数最多的字符:${res},出现了${max}次`);
  24. // 排序
  25. let str = "zhufengpeixunzhoulaoshi";
  26. str = str.split('').sort((a, b) => a.localeCompare(b)).join('');
  27. // console.log(str); // "aeefghhhiilnnoopsuuuxzz"
  28. let ary = str.match(/([a-zA-Z])\1+/g).sort((a, b) => b.length - a.length);
  29. // console.log(ary); // ["hhh", "uuu", "ee", "ii", "nn", "oo", "zz"]
  30. let max = ary[0].length,
  31. res = [ary[0].substr(0, 1)];
  32. for (let i = 1; i < ary.length; i++) {
  33. let item = ary[i];
  34. if (item.length < max) {
  35. break;
  36. }
  37. res.push(item.substr(0, 1));
  38. }
  39. console.log(`出现次数最多的字符:${res},出现了${max}次`);
  40. // 从最大到最小去试找
  41. let str = "zhufengpeixunzhoulaoshi",
  42. max = 0,
  43. res = [],
  44. flag = false;
  45. str = str.split('').sort((a, b) => a.localeCompare(b)).join('');
  46. for (let i = str.length; i > 0; i--) {
  47. let reg = new RegExp("([a-zA-Z])\\1{" + (i - 1) + "}", "g");
  48. str.replace(reg, (content, $1) => {
  49. res.push($1);
  50. max = i;
  51. flag = true;
  52. });
  53. if (flag) break;
  54. }
  55. console.log(`出现次数最多的字符:${res},出现了${max}次`);

其它方法:formatTime 、 queryURLParams 、 millimeter

  1. ~ function () {
  2. /*
  3. * formatTime:时间字符串的格式化处理
  4. * @params
  5. * templete:[string] 我们最后期望获取日期格式的模板
  6. * 模板规则:{0}->年 {1~5}->月日时分秒
  7. * @return
  8. * [string]格式化后的时间字符串
  9. */
  10. function formatTime(templete = "{0}年{1}月{2}日 {3}时{4}分{5}秒") {
  11. let timeAry = this.match(/\d+/g);
  12. return templete.replace(/\{(\d+)\}/g, (...[, $1]) => {
  13. let time = timeAry[$1] || "00";
  14. return time.length < 2 ? "0" + time : time;
  15. });
  16. }
  17. /*
  18. * queryURLParams:获取 URL 地址问号和面的参数信息(可能也包含 HASH 值)
  19. * @params
  20. * @return
  21. * [object]把所有问号参数信息以键值对的方式存储起来并且返回
  22. */
  23. function queryURLParams() {
  24. let obj = {};
  25. this.replace(/([^?=&#]+)=([^?=&#]+)/g, (...[, $1, $2]) => obj[$1] = $2);
  26. this.replace(/#([^?=&#]+)/g, (...[, $1]) => obj['HASH'] = $1);
  27. return obj;
  28. }
  29. /*
  30. * millimeter:实现大数字的千分符处理
  31. * @params
  32. * @return
  33. * [string]千分符后的字符串
  34. */
  35. function millimeter() {
  36. return this.replace(/\d{1,3}(?=(\d{3})+$)/g, content => content + ',');
  37. }
  38. /* 扩展到内置类 String.prototype 上 */
  39. ["formatTime", "queryURLParams", "millimeter"].forEach(item => {
  40. String.prototype[item] = eval(item);
  41. });
  42. }();