k-medoids和k-means区别

  统计/机器学习 无监督学习    浏览次数: 736
0

k-medoids和k-means的主要区别是什么?

我明白k-means,其实主要是不明白k-medoids。

最好是用浅显的语言描述下,鞠躬致谢!


 

阳春面   2018-02-27 09:43



   3个回答 
4

看起来k-medoids和和K-means比较相似,但是K-medoids和K-means是有区别的,不一样的地方在于中心点的选取,在K-means中,我们将中心点取为当前cluster中所有数据点的平均值,在 K-medoids算法中,我们将从当前cluster 中选取这样一个点——它到其他所有(当前cluster中的)点的距离之和最小——作为中心点。

limoran   2018-03-02 10:43

2

K means里每个cluster的中心点是平均值点

K medoids里每个cluster的中心点是离平均值点最近的样本点

也就是说K medoids的中心点一定是数据集中存在的点


Jiho   2018-03-03 10:57

类似于mean和median的区别。 - Zealing   2018-03-15 13:38
不是吧,median对应的k-median吧,不是k-medoids - 得得得   2018-03-15 22:10
2

k-means,k-medians和k-medoids的 区别在于如何计算一个中心点代表整个cluster(让N对N的计算变为N对1):

k-means: 算中心点时,每个属性(attribute)单独算,距离函数是L2norm。每个属性可能是数据中没出现过的值。

k-medians: 算中心点时,每个属性单独算,距离函数是L1norm。每个属性是数据中出现过的值,但可能来至于不动数据点,所以中心点可能在数据中没出现过。这是attribute意义上的median。

k-medoids: 算中心点时,所有属性一起算,距离函数是自定。中心点在数据中出现过。这是数据点意义上的median。

举个例子,2维binary的数据只有三种可能{(0,0),(0,1),(1,0)}。

k-means可能出现(0.6,0.6)的中心点,k-medians可能出现(1,1)的中心点,k-medoids不可能出现(1,1)的中心点。

Zealing   2018-03-16 03:41

不是非常理解。k-means的话,单独算和一起算,没有区别吧?k-medoids的话,既然距离是自定义的,为什么就一定是median呢? - kykix   2018-03-16 07:23


  相关主题

K-MEANS初始点选择的问题   2回答

通俗地解释c-means以及fuzzy c-means是什么意思   1回答

关于小批量K均值(mini-batch K Means)的问题   2回答

如何用K Means做异常点检测?   1回答

Jenks和K Means在一维数据时,是不是等价的?   2回答

K Means初始点必须是样本中的点吗   2回答

二分法K Means的算法是什么?和普通的K Means有什么区别?   2回答

K-means怎么选K?   6回答

进行K-Means聚类前,需要对数据做怎样的预处理?   1回答

sklearn.cluster.KMeans可以用其他距离吗?   2回答

sklearn.cluster.KMeans用的哪种距离?   1回答

sklearn kmeans里的n_init是什么意思   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!