leetcode:722. 删除注释
题目
给一个 C++ 程序,删除程序中的注释。这个程序source
是一个数组,其中source[i]
表示第 i
行源码。 这表示每行源码由 '\n
‘ 分隔。
在 C++ 中有两种注释风格,行内注释和块注释。
- 字符串
//
表示行注释,表示//
和其右侧的其余字符应该被忽略。 - 字符串
/*
表示一个块注释,它表示直到下一个(非重叠)出现的*/
之间的所有字符都应该被忽略。(阅读顺序为从左到右)非重叠是指,字符串/*/
并没有结束块注释,因为注释的结尾与开头相重叠。
第一个有效注释优先于其他注释。
- 如果字符串
//
出现在块注释中会被忽略。 - 同样,如果字符串
/*
出现在行或块注释中也会被忽略。
如果一行在删除注释之后变为空字符串,那么不要输出该行。即,答案列表中的每个字符串都是非空的。
样例中没有控制字符,单引号或双引号字符。
- 比如,
source = "string s = "/* Not a comment. */";"
不会出现在测试样例里。
此外,没有其他内容(如定义或宏)会干扰注释。
我们保证每一个块注释最终都会被闭合, 所以在行或块注释之外的 /*
总是开始新的注释。
最后,隐式换行符可以通过块注释删除。 有关详细信息,请参阅下面的示例。
从源代码中删除注释后,需要以相同的格式返回源代码。
示例:
输入: source = ["/*Test program */", "int main()", "{ ", " // variable declaration ", "int a, b, c;", "/* This is a test", " multiline ", " comment for ", " testing */", "a = b + c;", "}"]
输出: ["int main()","{ "," ","int a, b, c;","a = b + c;","}"]
解释: 示例代码可以编排成这样:
/*Test program */
int main()
{
// variable declaration
int a, b, c;
/* This is a test
multiline
comment for
testing */
a = b + c;
}
第 1 行和第 6-9 行的字符串 /* 表示块注释。第 4 行的字符串 // 表示行注释。
编排后:
int main()
{
int a, b, c;
a = b + c;
}
输入: source = ["a/*comment", "line", "more_comment*/b"]
输出: ["ab"]
解释: 原始的 source 字符串是 "a/*comment\nline\nmore_comment*/b", 其中我们用粗体显示了换行符。删除注释后,隐含的换行符被删除,留下字符串 "ab" 用换行符分隔成数组时就是 ["ab"].
解答 & 代码
设置状态 inBlockComment
,true
代表当前处于块注释中
,false
代表未处于块注释
逐行分析代码:
- 如果当前状态为
未处于块注释中
,则将newLine
重新置空,否则不置空(因为这说明/*
在之前的行中,*/
之后的字符会被接在/*
之前的字符后面) - 分析当前行的每个字符:
- 如果遇到
//
,且当前未处于块注释中
,则当前行后序字符都是注释,删除,因此结束对当前行的遍历 - 如果遇到
/*
,且当前未处于块注释中
,则开启了块注释,将inBlockComment
设为true
,并跳过/*
,继续分析后续字符 - 如果遇到
*/
,且当前处于块注释中
,则结束了块注释,将inBlockComment
设为false
,并跳过*/
,继续分析后续字符 - 如果是其他情况,且当前
未处于块注释中
,则将当前字符添加到newLine
末尾,继续分析下一字符 - 如果是其他情况,且当前
处于块注释中
,则跳过,继续分析下一字符
- 如果遇到
分析完当前行的每一个字符后,如果当前
未处于块注释中
,且newLine
不为空,则将newLine
存入结果数组result
class Solution {
public:
vector<string> removeComments(vector<string>& source) {
vector<string> result;
string newLine;
bool inBlockComment = false;
int len = source.size();
for(int i = 0; i < len; ++i)
{
string line = source[i];
if(!inBlockComment)
newLine = "";
int pos = 0;
while(pos < line.size())
{
// 如果遇到 //,且当前未处于块注释中,则当前行后序字符都是注释,跳过
if(pos + 1 < line.size() && line[pos] == '/' && line[pos + 1] == '/' && !inBlockComment)
break;
// 如果遇到 /*,且当前未处于块注释中,则开启了块注释
else if(pos + 1 < line.size() && line[pos] == '/' && line[pos + 1] == '*' && !inBlockComment)
{
inBlockComment = true;
pos += 2;
}
// 如果遇到 */,且当前处于块注释中,则结束了块注释
else if(pos + 1 < line.size() && line[pos] == '*' && line[pos + 1] == '/' && inBlockComment)
{
inBlockComment = false;
pos += 2;
}
// 如果是其他情况,且当前未处于块注释中,则将当前字符添加到 newLine 末尾
else if(!inBlockComment)
{
newLine += line[pos];
++pos;
}
// 如果是其他情况,且当前处于块注释中,则跳过
else
++pos;
}
// 如果当前未处于块注释中,且 newLine 不为空,则将 newLine 存入结果数组 result
if(!inBlockComment && newLine.size() > 0)
result.push_back(newLine);
}
return result;
}
};
复杂度分析:设源代码总长度(字符数)为 S
时间复杂度 O(S):最坏情况S下,字符串
s2
的每个字符分别被左、右指针遍历一次- 空间复杂度 O(S):一行代码
newLine
的空间复杂度不会超过 S
执行结果:
执行结果:通过
执行用时:4 ms, 在所有 C++ 提交中击败了 46.00% 的用户
内存消耗:7.6 MB, 在所有 C++ 提交中击败了 50.00% 的用户