二分法K Means的算法是什么?和普通的K Means有什么区别?

  统计/机器学习 无监督学习 开放问题
1

二分法K Means的算法是什么?和普通的K Means有什么区别?

谢谢!


 

FTD   2017-07-18 09:59



   2个回答 
3

二分法K Means(bisecting K Means)其实可以看作是一种阶层聚类(hierarchical clustering)方法。

  1. 第一步、确定K的大小
  2. 所有点都被在一个cluster当中
  3. 对所有点进行2 Means,得到两个聚类,比如说C1,C2
  4. 对C1或者C2进行2 Means,从而又一个聚类被一分为二,此时,我们就有三个cluster,C1,C2,C3
  5. 对C1,C2或者C3其中一个clustering再进行2 Means,此时我们就有4个cluster。
  6. 反复进行,直到我们产生出K个cluster为止。

二分法K Means可以保证收敛到最优,而普通的K Means却不能。


岛歌   2017-11-29 11:47

第4步里面“对C1或者C2进行2 Means”,那到底是C1还是C2呢?怎么确定的呢? - PR   2017-11-30 10:48
C1,C2两个都试试,分别计算SSE(sum of squared errors),哪个SSE小就选哪个 - 岛歌   2017-11-30 22:52
1

二分法K Mwans,其实就是逐步2 Means.,每进行一次,增加一个聚类,直到达到k为止


sasa   2017-12-02 21:17



相关问题

K-means怎么选K?   2回答

一维的数据可以做聚类吗?   3回答

什么是K-Modes(K众数)聚类法?   1回答

K-MEANS初始点选择的问题   1回答

关于小批量K均值(mini-batch K Means)的问题   2回答

层次聚类中的Ward's method是什么意思   0回答

软聚类,硬聚类?   1回答

层次聚类里的linkage是什么意思?   1回答

怎么评价一个聚类算法?   1回答

sklearn.cluster.KMeans用的哪种距离?   1回答

进行K-Means聚类前,需要对数据做怎样的预处理?   1回答

可视化K Means的时候怎么把聚类的中心点和样本点连起来?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!