全部问题问题热门未解答所有标签标签收藏收藏我要提问

K-MEANS初始点选择的问题

统计/机器学习无监督学习浏览次数：8340 分享

二维码

手机扫描二维码

机器学习面试也能刷题？

对于K-Means聚类算法，一开始我们要先给K个初始点，一般来说是随机地选K个点作为起始。还有更好的选择初始点的方法吗？

雕牌 2017-04-11 09:39

2个回答

有的。可以选相距最远的K个点作为初始点。

K-Means的目的是为了找出K个截然不同的聚类。所以我们希望这K个聚类分得越开越好。初始点分开得远更有利于算法快速收敛。

SofaSofa数据科学社区 DS面试题库 DS面经

Nagozi 2017-04-15 08:29

Make sense! 好方法！ - 想当小五哥 2017-04-15 10:46

有Kmeans++算法。

https://en.wikipedia.org/wiki/K-means%2B%2B

Matlab的Kmean默认是Kmeans++。

SofaSofa数据科学社区 DS面试题库 DS面经

Zealing 2018-03-15 13:36

相关讨论

KMeans++是怎么选初始点的？

k-medoids和k-means区别

关于online KMeans步骤中成员更新分类的问题？

kmeans可以用在三维数据上吗？

K Means初始点必须是样本中的点吗

Jenks和K Means在一维数据时，是不是等价的？

kernal kmeans是什么意思？和一般的kmeans的区别是什么？

关于小批量K均值（mini-batch K Means）的问题

kmeans可以做并行化计算达到加速效果吗？

通俗地解释c-means以及fuzzy c-means是什么意思

随便看看

推荐系统里的ALS是什么意思？

hyperparameter与parameter的区别？

matplotlib画图怎么确保横坐标和纵坐标的单位长度一致？

概率论中的鞅是什么？

什么是混淆矩阵(confusion matrix)