K-MEANS初始点选择的问题

  统计/机器学习 无监督学习    浏览次数: 1155
3
对于K-Means聚类算法,一开始我们要先给K个初始点,一般来说是随机地选K个点作为起始。还有更好的选择初始点的方法吗?
 

雕牌   2017-04-11 09:39



   2个回答 
6

有的。可以选相距最远的K个点作为初始点。

K-Means的目的是为了找出K个截然不同的聚类。所以我们希望这K个聚类分得越开越好。初始点分开得远更有利于算法快速收敛。


Nagozi   2017-04-15 08:29

Make sense! 好方法! - 想当小五哥   2017-04-15 10:46
3

有Kmeans++算法。

https://en.wikipedia.org/wiki/K-means%2B%2B

Matlab的Kmean默认是Kmeans++。


Zealing   2018-03-15 13:36



  相关主题

k-medoids和k-means区别   3回答

Jenks和K Means在一维数据时,是不是等价的?   2回答

通俗地解释c-means以及fuzzy c-means是什么意思   1回答

K-Means实现mini-batch online learning的原理是什么?   1回答

如何用K Means做异常点检测?   3回答

K Means初始点必须是样本中的点吗   2回答

关于小批量K均值(mini-batch K Means)的问题   3回答

为什么K Means算法对样本的输入顺序比较敏感?   2回答

二分法K Means的算法是什么?和普通的K Means有什么区别?   2回答

K-means怎么选K?   6回答

进行K-Means聚类前,需要对数据做怎样的预处理?   1回答

特征归一化对K Means有影响吗?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!