算法概述

  • Principal Component Analysis
  • 主成分分析

image.png

  • 降维后的数据失去了原有的物理意义(可以用来加密)

image.png
image.png
image.png
image.png
image.png

协方差

image.png
image.png

优化目标

image.png
image.png
image.png

计算实例

image.png

  • 将原始数据以0为中心化,减去均值
  • 对协方差矩阵分解可以得到特征值和特征向量
  • 想要将两维数据降为一维,在特征值中选择一个最大的,同时取到对应的特征向量(作为基向量)
  • 将基向量单位化
  • 验证特征向量一定可以将原始的协方差矩阵变为一个对角阵
  • 用新的基向量处理原始数据

    Python实现

    计算协方差矩阵

    image.png
    image.png
    image.png

    矩阵分解

    image.png

  • 把特征值和特征向量组合成一对

image.png
image.png

  • cumsum解释

image.png
image.png

  • 可视化观察哪些特征比较重要

image.png

提取特征向量

image.png

作用于原始数据

image.png

可视化效果

image.png
image.png
image.png
image.png