算法概述
- Principal Component Analysis
- 主成分分析
- 降维后的数据失去了原有的物理意义(可以用来加密)
协方差
优化目标
计算实例
- 将原始数据以0为中心化,减去均值
- 对协方差矩阵分解可以得到特征值和特征向量
- 想要将两维数据降为一维,在特征值中选择一个最大的,同时取到对应的特征向量(作为基向量)
- 将基向量单位化
- 验证特征向量一定可以将原始的协方差矩阵变为一个对角阵
-
Python实现
计算协方差矩阵
矩阵分解
把特征值和特征向量组合成一对
- cumsum解释
- 可视化观察哪些特征比较重要