进行K-Means聚类前,需要对数据做怎样的预处理?

  统计/机器学习 无监督学习 数据预处理    浏览次数:11752        分享
0

进行K-Means聚类前,需要对数据做怎样的预处理?不是非常明白,请多多指教!

 

MeganC   2017-04-30 19:46



   1个回答 
3

对于数值变量,最重要的就是对原始数据标准化,使得每个变量的方差的大小相等。原因类似于我们PCA之前要先标准化

对于分类变量,要做编码。

SofaSofa数据科学社区DS面试题库 DS面经

蓝色北方   2017-05-01 08:53



  相关主题

kmeans可以用在三维数据上吗?   2回答

如何用K Means做异常检测(outlier anomaly detection)?   3回答

kmeans可以做并行化计算达到加速效果吗?   3回答

关于online KMeans步骤中成员更新分类的问题?   1回答

可视化K Means的时候怎么把聚类的中心点和样本点连起来?   1回答

二分法K Means的算法是什么?和普通的K Means有什么区别?   2回答

KMeans++是怎么选初始点的?   1回答

关于小批量K均值(mini-batch K Means)的问题   3回答

kernal kmeans是什么意思?和一般的kmeans的区别是什么?   0回答

K-means怎么选K?   7回答

K Means为什么不能收敛到全局最优点?   1回答

k-medoids和k-means区别   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!