请问从EM角度理解kmeans?

  • k-means是两个步骤交替进行,可以分别看成E步和M步
  • M步中将每类的中心更新为分给该类各点的均值,可以认为是在「各类分布均为单位方差的高斯分布」的假设下,最大化似然值;
  • E步中将每个点分给中心距它最近的类(硬分配),可以看成是EM算法中E步(软分配)的近似

    为什么kmeans一定会收敛?

    M步中的最大化似然值,更新参数依赖的是MSE,MSE至少存在局部最优解,必然收敛

    kmeans初始点除了随机选取之外的方法?

    先层次聚类,再在不同层次上选取初始点进行kmeans聚类