为什么PCA被称作非监督式学习?

  统计/机器学习 无监督学习 数据降维 开放问题    浏览次数:1858        分享
5

明明PCA不能直接用在聚类上,为什么PCA还是会被称为非监督式学习(unsupervised learning)?


在监督式学习中,PCA可以用来降维,为什么不称它为监督式学习(supervised learning)?


 

ljljlj   2017-10-04 23:33



   2个回答 
7

非监督式学习是个很大的范畴,并不只是聚类。

贴一段维基百科对非监督式学习的解释。

Unsupervised machine learning is the machine learning task of inferring a function to describe hidden structure from "unlabeled" data.

大意是说对没有标签的数据进行发掘探索就是非监督式学习

我们知道,用PCA对数据进行降维时,我们是不需要数据的标签的(也就是在做PCA时,我们会剔除y那列),所以这也符合了非监督学习的定义。



SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2017-10-09 10:10

3

PCA并没有用到label的信息,所以是unsupervised。


SofaSofa数据科学社区DS面试题库 DS面经

岛歌   2017-10-09 10:44



  相关主题

PCA算法是一种保距算法吗?   0回答

PCA与非负矩阵分解(NMF)的异同?   0回答

Truncated SVD和PCA有什么区别吗?   1回答

PCA需要正态性作为提前假设吗?   1回答

PCA会降低分类器的精度吗?   3回答

PCA降维中的特征值和特征向量   2回答

PCA降维之前为什么要先标准化?   2回答

除了PCA,还有什么降维的方法?   11回答

利用PCA降维,降到几维比较合适?   1回答

PCA和SVD是一回事吗?   1回答

PCA的目标函数   1回答

sklearn pca 数据降维结果不一致   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!