PCA
- PCA(Principal Component Analysis) 主成分分析, 用于高维数据集的探索与可视化,还可以用作数据压缩和预处理等。
- PCA可把具有相关性的高维变量合成为线性无关的低维变量,成为主成分。主成分能够尽可能保留原始数据的信息。
- Terms:
- 方差,各个样本和样本均值的差的平方和的均值,用来度量一组数据的分散程度。$s^2 = \frac{\sum_{i=1}^n (x_i – x)^2}{n-1}$
- 协方差,用于度量两个变量之间的线性相关性程度。$Cov(X,Y)=\frac{\sum_{i=1}^n (X_i-\overline{X})(Y_i – \overline{Y})}{n-1}$
- 协方差矩阵,变量的协方差值构成的矩阵。
- 特征向量,描述数据集结构的非零向量 $A\overrightarrow{v}=\lambda \overrightarrow{v}$