leetcode:722. 删除注释

题目

给一个 C++ 程序,删除程序中的注释。这个程序source是一个数组,其中source[i]表示第 i 行源码。 这表示每行源码由 '\n‘ 分隔。

在 C++ 中有两种注释风格,行内注释和块注释。

  • 字符串 // 表示行注释,表示 // 和其右侧的其余字符应该被忽略。
  • 字符串 /* 表示一个块注释,它表示直到下一个(非重叠)出现的 */ 之间的所有字符都应该被忽略。(阅读顺序为从左到右)非重叠是指,字符串 /*/ 并没有结束块注释,因为注释的结尾与开头相重叠。

第一个有效注释优先于其他注释。

  • 如果字符串 // 出现在块注释中会被忽略。
  • 同样,如果字符串 /* 出现在行或块注释中也会被忽略。

如果一行在删除注释之后变为空字符串,那么不要输出该行。即,答案列表中的每个字符串都是非空的。

样例中没有控制字符,单引号或双引号字符。

  • 比如,source = "string s = "/* Not a comment. */";" 不会出现在测试样例里。

此外,没有其他内容(如定义或宏)会干扰注释。
我们保证每一个块注释最终都会被闭合, 所以在行或块注释之外的 /* 总是开始新的注释。
最后,隐式换行符可以通过块注释删除。 有关详细信息,请参阅下面的示例。
从源代码中删除注释后,需要以相同的格式返回源代码。

示例:

  1. 输入: source = ["/*Test program */", "int main()", "{ ", " // variable declaration ", "int a, b, c;", "/* This is a test", " multiline ", " comment for ", " testing */", "a = b + c;", "}"]
  2. 输出: ["int main()","{ "," ","int a, b, c;","a = b + c;","}"]
  3. 解释: 示例代码可以编排成这样:
  4. /*Test program */
  5. int main()
  6. {
  7. // variable declaration
  8. int a, b, c;
  9. /* This is a test
  10. multiline
  11. comment for
  12. testing */
  13. a = b + c;
  14. }
  15. 1 行和第 6-9 行的字符串 /* 表示块注释。第 4 行的字符串 // 表示行注释。
  16. 编排后:
  17. int main()
  18. {
  19. int a, b, c;
  20. a = b + c;
  21. }
  1. 输入: source = ["a/*comment", "line", "more_comment*/b"]
  2. 输出: ["ab"]
  3. 解释: 原始的 source 字符串是 "a/*comment\nline\nmore_comment*/b", 其中我们用粗体显示了换行符。删除注释后,隐含的换行符被删除,留下字符串 "ab" 用换行符分隔成数组时就是 ["ab"].

解答 & 代码

设置状态 inBlockCommenttrue 代表当前处于块注释中false 代表未处于块注释
逐行分析代码:

  • 如果当前状态为未处于块注释中,则将 newLine 重新置空,否则不置空(因为这说明 /* 在之前的行中,*/之后的字符会被接在 /* 之前的字符后面)
  • 分析当前行的每个字符:
    1. 如果遇到 //,且当前未处于块注释中,则当前行后序字符都是注释,删除,因此结束对当前行的遍历
    2. 如果遇到 /*,且当前未处于块注释中,则开启了块注释,将 inBlockComment 设为 true,并跳过 /*,继续分析后续字符
    3. 如果遇到 */,且当前处于块注释中,则结束了块注释,将 inBlockComment 设为 false,并跳过 */,继续分析后续字符
    4. 如果是其他情况,且当前未处于块注释中,则将当前字符添加到 newLine 末尾,继续分析下一字符
    5. 如果是其他情况,且当前处于块注释中,则跳过,继续分析下一字符
  • 分析完当前行的每一个字符后,如果当前未处于块注释中,且 newLine 不为空,则将 newLine 存入结果数组 result

    1. class Solution {
    2. public:
    3. vector<string> removeComments(vector<string>& source) {
    4. vector<string> result;
    5. string newLine;
    6. bool inBlockComment = false;
    7. int len = source.size();
    8. for(int i = 0; i < len; ++i)
    9. {
    10. string line = source[i];
    11. if(!inBlockComment)
    12. newLine = "";
    13. int pos = 0;
    14. while(pos < line.size())
    15. {
    16. // 如果遇到 //,且当前未处于块注释中,则当前行后序字符都是注释,跳过
    17. if(pos + 1 < line.size() && line[pos] == '/' && line[pos + 1] == '/' && !inBlockComment)
    18. break;
    19. // 如果遇到 /*,且当前未处于块注释中,则开启了块注释
    20. else if(pos + 1 < line.size() && line[pos] == '/' && line[pos + 1] == '*' && !inBlockComment)
    21. {
    22. inBlockComment = true;
    23. pos += 2;
    24. }
    25. // 如果遇到 */,且当前处于块注释中,则结束了块注释
    26. else if(pos + 1 < line.size() && line[pos] == '*' && line[pos + 1] == '/' && inBlockComment)
    27. {
    28. inBlockComment = false;
    29. pos += 2;
    30. }
    31. // 如果是其他情况,且当前未处于块注释中,则将当前字符添加到 newLine 末尾
    32. else if(!inBlockComment)
    33. {
    34. newLine += line[pos];
    35. ++pos;
    36. }
    37. // 如果是其他情况,且当前处于块注释中,则跳过
    38. else
    39. ++pos;
    40. }
    41. // 如果当前未处于块注释中,且 newLine 不为空,则将 newLine 存入结果数组 result
    42. if(!inBlockComment && newLine.size() > 0)
    43. result.push_back(newLine);
    44. }
    45. return result;
    46. }
    47. };

    复杂度分析:设源代码总长度(字符数)为 S

  • 时间复杂度 O(S):最坏情况S下,字符串 s2 的每个字符分别被左、右指针遍历一次

  • 空间复杂度 O(S):一行代码 newLine 的空间复杂度不会超过 S

执行结果:

  1. 执行结果:通过
  2. 执行用时:4 ms, 在所有 C++ 提交中击败了 46.00% 的用户
  3. 内存消耗:7.6 MB, 在所有 C++ 提交中击败了 50.00% 的用户