字符串 S 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一字母最多出现在一个片段中。返回一个表示每个字符串片段的长度的列表。
示例:
输入:S = “ababcbacadefegdehijhklij”
输出:[9,7,8]
解释:
划分结果为 “ababcbaca”, “defegde”, “hijhklij”。
每个字母最多出现在一个片段中。
像 “ababcbacadefegde”, “hijhklij” 的划分是错误的,因为划分的片段数较少。
思路分析
贪心由于同一个字母只能出现在同一个片段,显然同一个字母的第一次出现的下标位置和最后一次出现的下标位置必须出现在同一个片段。因此需要遍历字符串,得到每个字母最后一次出现的下标位置。
在得到每个字母最后一次出现的下标位置之后,可以使用贪心的方法将字符串划分为尽可能多的片段,具体做法如下。
从左到右遍历字符串,遍历的同时维护当前片段的开始下标 start 和结束下标 end,初始时 start=end=0。
对于每个访问到的字母 x,得到当前字母的最后一次出现的下标位置 end(x) ,则当前片段的结束下标一定不会小于 end(x) ,因此令 end=max(end, end(x))。
当访问到下标 end 时,当前片段访问结束,当前片段的下标范围是 [start,end],长度为 end−start+1,将当前片段的长度添加到返回值,然后令 start=end+1,继续寻找下一个片段。
重复上述过程,直到遍历完字符串。
上述做法使用贪心的思想寻找每个片段可能的最小结束下标,因此可以保证每个片段的长度一定是符合要求的最短长度,如果取更短的片段,则一定会出现同一个字母出现在多个片段中的情况。由于每次取的片段都是符合要求的最短的片段,因此得到的片段数也是最多的。
由于每个片段访问结束的标志是访问到下标 end,因此对于每个片段,可以保证当前片段中的每个字母都一定在当前片段中,不可能出现在其他片段,可以保证同一个字母只会出现在同一个片段。
/**
* @param {string} s
* @return {number[]}
*/
var partitionLabels = function(s) {
const last = new Array(26);
const length = s.length;
const codePointA = 'a'.codePointAt(0);
for (let i = 0; i < length; i++) { // 记录字符串中每个字母最后出现的位置
last[s.codePointAt(i) - codePointA] = i;
}
const partition = [];
let start = 0, end = 0; // 用end 和 start来划分现在的一个区间
for (let i = 0; i < length; i++) {
// 贪心策略:每次刷新到最小的但是要全部包含字母的位置
end = Math.max(end, last[s.codePointAt(i) - codePointA]);
if (i == end) { // 如果指针i找到了end的话,就代表这个区间已经搜索完毕
partition.push(end - start + 1);
start = end + 1;
}
}
return partition;
};