题目

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。

‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

示例 1:

输入:s = “aa”, p = “a”
输出:false
解释:”a” 无法匹配 “aa” 整个字符串。

示例 2:

输入:s = “aa”, p = “a
输出:true
解释:因为 ‘
‘ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此,字符串 “aa” 可被视为 ‘a’ 重复了一次。

示例 3:

输入:s = “ab”, p = “.*”
输出:true
解释:”.“ 表示可匹配零个或多个(’‘)任意字符(’.’)。

提示:

1 <= s.length <= 20
1 <= p.length <= 30
s 只包含从 a-z 的小写字母。
p 只包含从 a-z 的小写字母,以及字符 . 和
保证每次出现字符
时,前面都匹配到有效的字符

来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/regular-expression-matching
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

思路

本题的关键是要理解10. 正则表达式匹配 - 图1或者说10. 正则表达式匹配 - 图2的含义,对于后者10. 正则表达式匹配 - 图3比较简单,就是可以将a重复任意次数,0次、1次、2次、…、无数次

对于10. 正则表达式匹配 - 图4也一样,可以将10. 正则表达式匹配 - 图5重复任意次,而10. 正则表达式匹配 - 图6本身可以充当任意字符,所以10. 正则表达式匹配 - 图7和’’(空串)、’ab’、’aa’、’abc’等都是可以匹配的,换句话说,10. 正则表达式匹配 - 图8可以匹配任意字符串。

理解了10. 正则表达式匹配 - 图9的含义之后,就是使用DP分析10. 正则表达式匹配 - 图10状态如何转移,10. 正则表达式匹配 - 图11定义为s[0:i]和p[0:j]是否匹配。具体如何转移见注释。

代码

  1. class Solution {
  2. public boolean isMatch(String s, String p) {
  3. int m = s.length();
  4. int n = p.length();
  5. if (n == 0) {
  6. return m == 0;
  7. }
  8. char[] sarr = s.toCharArray();
  9. char[] parr = p.toCharArray();
  10. boolean[][] dp = new boolean[m + 1][n + 1];
  11. // 两个都是空串,可以匹配
  12. dp[0][0] = true;
  13. // s空串和偶数长度以*结尾的p串可以匹配,如p='a*b*'可以和s=''匹配,但是p='a*bb'则不可以和s=''匹配
  14. for (int i = 2; i < n + 1; i += 2) {
  15. if (parr[i - 1] == '*') {
  16. dp[0][i] = true;
  17. } else {
  18. break;
  19. }
  20. }
  21. for (int i = 1; i < m + 1; ++i) {
  22. for (int j = 1; j < n + 1; ++j) {
  23. // s[i]==p[j]或者p[j]='.',可以匹配,这很好理解
  24. if (sarr[i - 1] == parr[j - 1] || parr[j - 1] == '.') {
  25. dp[i][j] = dp[i - 1][j - 1];
  26. } else if (parr[j - 1] == '*') {
  27. // 接下来讨论p[j]='*'
  28. // 关注p[j-1]和s[i]是否相同,如果不同且p[j-1]不是'.',那么只能抛弃p[j-1]和p[j]
  29. if (parr[j - 2] != sarr[i - 1] && parr[j - 2] != '.') {
  30. dp[i][j] = dp[i][j - 2];
  31. } else {
  32. // p[j-1]和s[i]相同,或者p[j-1]是'.'
  33. // 根据上面的分析,p[j-1]和p[j]作为一个整体,可以将p[j-1]出现0次、1次、多次
  34. // 出现0次就是对应抛弃p[j-1]和p[j],考虑s[0:i]和p[0:j-2]是否匹配,对应代码dp[i][j - 2]
  35. // 出现1次和多次同理,分别对应dp[i - 1][j - 2]和dp[i - 1][j]
  36. // ----注意,这里dp[i - 1][j]其实包含了dp[i - 1][j - 2],即后者可以转移到前者,目前我还不能完全理解,因此先这样写----
  37. dp[i][j] = dp[i][j - 2] || dp[i - 1][j - 2] || dp[i - 1][j];
  38. }
  39. }
  40. }
  41. }
  42. return dp[m][n];
  43. }
  44. }