并查集 - 账户合并 - 《数据结构与算法》

题目
思路分析

题目

题目来源：力扣（LeetCode）

给定一个列表 accounts，每个元素 accounts[i] 是一个字符串列表，其中第一个元素 accounts[i][0] 是名称 (name)，其余元素是 emails 表示该账户的邮箱地址。
现在，我们想合并这些账户。如果两个账户都有一些共同的邮箱地址，则两个账户必定属于同一个人。请注意，即使两个账户具有相同的名称，它们也可能属于不同的人，因为人们可能具有相同的名称。一个人最初可以拥有任意数量的账户，但其所有账户都具有相同的名称。

合并账户后，按以下格式返回账户：每个账户的第一个元素是名称，其余元素是按字符 ASCII 顺序排列的邮箱地址。账户本身可以以任意顺序返回。

示例 1：

输入：

accounts = [[“John”, “johnsmith@mail.com”, “john00@mail.com”], [“John”, “johnnybravo@mail.com”], [“John”, “johnsmith@mail.com”, “john_newyork@mail.com”], [“Mary”, “mary@mail.com”]]

输出：
[[“John”, ‘john00@mail.com’, ‘john_newyork@mail.com’, ‘johnsmith@mail.com’], [“John”, “johnnybravo@mail.com”], [“Mary”, “mary@mail.com”]]

解释：
第一个和第三个 John 是同一个人，因为他们有共同的邮箱地址 “johnsmith@mail.com”。
第二个 John 和 Mary 是不同的人，因为他们的邮箱地址没有被其他帐户使用。
可以以任何顺序返回这些列表，例如答案 [[‘Mary’，’mary@mail.com’]，[‘John’，’johnnybravo@mail.com’]，
[‘John’，’john00@mail.com’，’john_newyork@mail.com’，’johnsmith@mail.com’]] 也是正确的。

思路分析

1、两个账户合并，当且仅当两个账户至少有一个共同的邮箱地址，因此这道题的实质是判断所有的邮箱地址中有哪些邮箱地址必定属于同一人，可以使用并查集实现。

2、为了使用并查集实现账户合并，需要知道一共有多少个不同的邮箱地址，以及每个邮箱对应的名称，因此需要使用两个哈希表分别记录每个邮箱对应的编号和每个邮箱对应的名称，遍历所有的账户并在两个哈希表中记录相应的信息。虽然同一个邮箱地址可能在多个账户中出现，但是同一个邮箱地址在两个哈希表中都只能存储一次。

3、然后使用并查集进行合并操作。由于同一个账户中的邮箱地址一定属于同一个人，因此遍历每个账户，对账户中的邮箱地址进行合并操作。并查集存储的是每个邮箱地址对应的编号，合并操作也是针对编号进行合并。

4、完成并查集的合并操作后，即可知道合并后有多少个不同的账户。遍历所有的邮箱地址，对于每个邮箱地址，通过并查集得到该邮箱地址属于哪个合并后的账户，即可整理出每个合并后的账户包含哪些邮箱地址。

5、对于每个合并后的账户，需要整理出题目要求的返回账户的格式，具体的做法是：将邮箱地址排序，账户的名称可以通过在哈希表中查找任意一个邮箱对应的名称得到，将名称和排序后的邮箱地址整理成一个账户列表。对所有合并后的账户整理出账户列表，即可得到最终答案。

/**
 * @param {string[][]} accounts
 * @return {string[][]}
 */
var accountsMerge = function (accounts) {
  const emailToIndexMap = new Map();//邮箱+坐标
  const emailToNameMap = new Map();//邮箱+名称
  let emailsCount = 0;
  // 遍历二维数组
  for (const account of accounts) {
    // 获取每个账户的名称
    const name = account[0];
    const size = account.length;//
    // 遍历账户中的邮箱
    for (let i = 1; i < size; i++) {// 在数组中从第二个元素开始都是邮箱(在数组中的索引为 1)，因此从 1  开始遍历账户中的邮箱
      const email = account[i];//拿到邮箱
      if (!emailToIndexMap.has(email)) {// 该 email 在 emailToIndexMap 中不存在
        emailToIndexMap.set(email, emailsCount++);// 在 emailToIndexMap 中存储该 email 的编号
        emailToNameMap.set(email, name);// 在 emailToNameMap 中存储该 email 所对应的账户名称
      }
    }
  }
  // 至此我们就把 邮箱坐标，邮箱+名称这两个map表格创建完了
  // 两个map创建完了，拿到邮箱数量了，这样我们就可以创建并查集了
  const uf = new UnionFind(emailsCount);// 通过邮箱的数量构建并查集
  // 根据两个map对邮箱进行合并
  for (const account of accounts) {
    const firstEmail = account[1];// 拿到第一个邮箱
    const firstIndex = emailToIndexMap.get(firstEmail);// 获取到当前 email 在 emailToIndexMap中存储的 编号
    const size = account.length;//
    for (let i = 2; i < size; i++) {// 开始拿第二个邮箱，开始跟第一个邮箱进行连通
      const nextEmail = account[i];//拿到后面的每一个邮箱
      const nextIndex = emailToIndexMap.get(nextEmail);//根据这个邮箱，拿到他对应的在map里面的下标
      uf.unite(firstIndex, nextIndex);//进行连通
    }
  }
  // 全给拿出来
  const indexToEmails = new Map();//K是并查集祖先坐标 v是邮箱集合，如果坐标当作k，那么我们如何拿到k
  //从emailToIndexMap拿坐标，所有的邮箱就拿到了，拿到每一个邮箱
  for (const email of emailToIndexMap.keys()) {
    const index = uf.findSet(emailToIndexMap.get(email));//拿到祖先的坐标
    const account = indexToEmails.get(index) ? indexToEmails.get(index) : [];//拿坐标
    account.push(email);//把邮箱添加完
    indexToEmails.set(index, account);//根据祖先节点分好组
  }
  //做用户之间的合并
  const merged = [];//建一个数组
  for (const emails of indexToEmails.values()) { //获取到邮箱的集合，合并之前要按着ascll进行排序
    emails.sort();
    const name = emailToNameMap.get(emails[0]);// 拿到名称
    const account = [];//
    account.push(name);// 添加名字
    account.push(...emails);// 添加邮箱
    merged.push(account);//把数组集合添加进去
  }
  return merged;//完成用户之间的合并
};
// 并查集
class UnionFind {
  constructor(n) {
    // 元素所指向的父节点，parent[i] 表示第 i 个元素所指向的父节点
    // 初始化时, 每一个parent[i]指向自己, 表示每一个元素自己自成一个集合
    this.parent = new Array(n).fill(0).map((value, index) => index);
    // 树的层数，rank[i] 表示以 i 为根的集合所表示的树的层数
    this.rank = new Array(n).fill(1);
    // 节点的个数
    this.setCount = n;
  }
  // 查找过程，查找元素 index 所在集合的编号(查找树的根节点)
  findSet(index) {
    // 不断去查询自己的父节点，直至根节点
    // 根节点的标志是父节点就是本身  parent[index] == index
    if (this.parent[index] != index) {
      // 递归获取节点的父节点
      this.parent[index] = this.findSet(this.parent[index]);
    }
    // 返回根节点
    return this.parent[index];
  }
  // 合并两个集合
  unite(index1, index2) {
    let root1 = this.findSet(index1);
    let root2 = this.findSet(index2);
    // 根节点不一样，是两个不同的集合(两棵不同的树)
    if (root1 != root2) {
      // 根据树的层数合并集合
      // 
      if (this.rank[root1] < this.rank[root2]) {
        // 这个判断如果 root2 所在树的层数 大于 root1，就交换两个父节点，这样始终让 root1 为父节点
        [root1, root2] = [root2, root1];
      }
      // 将层数多的集合合并到集合少的集合
      this.parent[root2] = root1;
      this.rank[root1] += this.rank[root2];
      this.setCount--;
    }
  }
  getCount() {
    return this.setCount;
  }
  connected(index1, index2) {
    return this.findSet(index1) === this.findSet(index2);
  }
}