• 定义:PCA也叫主成分分析
  • 分类:一个非监督的机器学习算法
  • 作用:一种基本的数据降维技术。目的就是要从这些现有的特征中重建新的特征,新的特征剔除了原有特征的冗余信息,因此更有区分度。
  • 其他应用︰可视化;去噪
  • 理解:本质是将N维正交坐标系进行旋转;N个主成分从前到后按相关性大小排序。

    降维方式一

    tmp.gif

    降维方式对比

    右图相比左图,点间的差距更大,更能体现原来点的特征。
    image.png

    降维方式二

    降维到一根直线上(或者说一个新的坐标系上),比降维到其它特征,更能代表原数据。
    tmp.gif

    最大效用函数

    PCA问题最终转化为了最优化问题。
    image.png