聚类问题需不需要分出测试集?

  统计/机器学习 无监督学习 模型验证    浏览次数: 110
0

以前做K-Means之类的聚类,好像都没有划分训练集和测试集,都是用了整个数据集。

我想知道聚类问题到底需不需要分出测试集?

 

vivian_o   2018-11-12 14:14



   1个回答 
2

这个问题见仁见智吧

分出test data有时候可以用来检验是否overfitting

SofaSofa数据科学社区 DS面经 问答 实战

Lydia   2018-12-03 23:17



  相关主题

怎么理解聚类算法的评价指标Rand Index(RI)?   2回答

怎么评价一个聚类算法?   2回答

层次聚类中的Ward's method是什么意思   1回答

层次聚类里的linkage是什么意思?   2回答

什么是K-Modes(K众数)聚类法?   1回答

谱聚类中的相似矩阵是怎么定义的?   0回答

聚类问题可以用stacking model的方法吗?   2回答

软聚类,硬聚类?   1回答

python中实现k-modes的包   1回答

有没有对聚类成员个数有限制的聚类算法?   2回答

一维的数据可以做聚类吗?   3回答

离群点、孤立点、异常点有什么区别吗?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!