主成分分析法(PCA)算是黑盒算法吗？-SofaSofa

才接触机器学习不大久，了解到主成分分析，是线性降维的方法，但是降维之后的特征和原来的特征好像就不大对的上了。那么PCA算是黑盒算法吗？

特级开心果 2022-03-18 22:40

PCA这种降维方式是把原来的m个变量，进行糅杂，缩减到n个新组建的变量上。至于新组建的变量又是原变量的线性组合。线性组合本身具有可解释性，但是这些变量硬组合在一起，基本上是无法理解的。我觉得是类似黑盒的。

举个例子，比如说对一个商品数据进行pca降维，其中一个新变量是 2*商品价格 - 0.5*商品重量 + 1.2*商品销量；这种情况下，就完全没有可解释性了。

yxyu 2022-04-03 16:54

特征选择是从已存在的特征中选取携带信息最多的，选完之后的特征依然具有可解释性，我们依然知道这个特征在原数据的哪个位置，代表着原数据上的什么含义。

PCA是降维算法，将已存在的特征进行压缩，降维完毕后的特征不是原本的特征矩阵中的任何一个特征，而是通过某些方式组合起来的新特征。通常来说，在新的特征矩阵生成之前，我们无法知晓降维算法们都建立了怎样的新特征向量，新特征矩阵生成之后也不具有可读性。

PCA一般不适用于探索特征和标签之间的关系的模型（如线性回归），因为无法解释的新特征和标签之间的关系不具有意义。在线性回归模型中，我们更倾向于用特征选择。

简Cheng 2022-04-07 10:08

主成分分析法(PCA)算是黑盒算法吗？