描述
如果交换字符串 X
中的两个不同位置的字母,使得它和字符串 Y
相等,那么称 X
和 Y
两个字符串相似。如果这两个字符串本身是相等的,那它们也是相似的。
例如,"tars"
和 "rats"
是相似的 (交换 0
与 2
的位置); "rats"
和 "arts"
也是相似的,但是 "star"
不与 "tars"
,"rats"
,或 "arts"
相似。
总之,它们通过相似性形成了两个关联组:{"tars", "rats", "arts"}
和 {"star"}
。注意,"tars"
和 "arts"
是在同一组中,即使它们并不相似。形式上,对每个组而言,要确定一个单词在组中,只需要这个词和该组中至少一个单词相似。
给定一个字符串列表 strs
。列表中的每个字符串都是 strs
中其它所有字符串的一个 字母异位词 。请问 strs
中有多少个相似字符串组?
字母异位词(anagram),一种把某个字符串的字母的位置(顺序)加以改换所形成的新词。
示例
示例 1:
输入:strs = ["tars","rats","arts","star"]
输出:2
示例 2:
输入:strs = ["omv","ovm"]
输出:1
提示
1 <= strs.length <= 300
1 <= strs[i].length <= 300
strs[i]
只包含小写字母。strs
中的所有单词都具有相同的长度,且是彼此的字母异位词。
解题思路
我们把每一个字符串看作点,字符串之间是否相似看作边,那么可以发现本题询问的是给定的图中有多少连通分量。于是可以想到使用并查集维护节点间的连通性。
我们枚举给定序列中的任意一对字符串,检查其是否具有相似性,如果相似,那么我们就将这对字符串相连。
在实际代码中,我们可以首先判断当前这对字符串是否已经连通,如果没有连通,我们再检查它们是否具有相似性,可以优化一定的时间复杂度的常数。
代码思路:
- 两重 for 循环,实现对节点之间两两组合,判断两个节点是否相似;
- 判断相似的方法是:两个字符串的对应位置中只有 0 个或者 2 个不同;
- 如果两个字符串相似则使用并查集,将此两个节点之间连通上一条边;
- 统计最终并查集中有多少个不同的连通区域,即为所求。
代码
class Solution {
int[] f;
public int numSimilarGroups(String[] strs) {
int n = strs.length;
int m = strs[0].length();
f = new int[n];
for (int i = 0; i < n; i++) {
f[i] = i;
}
for (int i = 0; i < n - 1; i++) {
for (int j = i + 1; j < n; j++) {
int fi = find(i), fj = find(j);
if (fi == fj) continue;
if (chenk(strs[i], strs[j], m)) {
f[fi] = fj;
}
}
}
int res = 0;
for (int i = 0; i < n; i++) {
if (f[i] == i) {
res++;
}
}
return res;
}
public int find(int x) {
if (f[x] != x) {
f[x] = find(f[x]);
}
return f[x];
}
public boolean chenk(String st1, String st2, int m) {
int count = 0;
for (int i = 0; i < m; i++) {
if (st1.charAt(i) != st2.charAt(i)) {
count++;
}
}
return count == 0 || count == 2;
}
}