k-medoids和k-means区别

  统计/机器学习 无监督学习    浏览次数:9003        分享
0

k-medoids和k-means的主要区别是什么?

我明白k-means,其实主要是不明白k-medoids。

最好是用浅显的语言描述下,鞠躬致谢!


 

阳春面   2018-02-27 09:43



   3个回答 
4

看起来k-medoids和和K-means比较相似,但是K-medoids和K-means是有区别的,不一样的地方在于中心点的选取,在K-means中,我们将中心点取为当前cluster中所有数据点的平均值,在 K-medoids算法中,我们将从当前cluster 中选取这样一个点——它到其他所有(当前cluster中的)点的距离之和最小——作为中心点。

SofaSofa数据科学社区DS面试题库 DS面经

limoran   2018-03-02 10:43

2

K means里每个cluster的中心点是平均值点

K medoids里每个cluster的中心点是离平均值点最近的样本点

也就是说K medoids的中心点一定是数据集中存在的点


SofaSofa数据科学社区DS面试题库 DS面经

Jiho   2018-03-03 10:57

类似于mean和median的区别。 - Zealing   2018-03-15 13:38
不是吧,median对应的k-median吧,不是k-medoids - 得得得   2018-03-15 22:10
2

k-means,k-medians和k-medoids的 区别在于如何计算一个中心点代表整个cluster(让N对N的计算变为N对1):

k-means: 算中心点时,每个属性(attribute)单独算,距离函数是L2norm。每个属性可能是数据中没出现过的值。

k-medians: 算中心点时,每个属性单独算,距离函数是L1norm。每个属性是数据中出现过的值,但可能来至于不动数据点,所以中心点可能在数据中没出现过。这是attribute意义上的median。

k-medoids: 算中心点时,所有属性一起算,距离函数是自定。中心点在数据中出现过。这是数据点意义上的median。

举个例子,2维binary的数据只有三种可能{(0,0),(0,1),(1,0)}。

k-means可能出现(0.6,0.6)的中心点,k-medians可能出现(1,1)的中心点,k-medoids不可能出现(1,1)的中心点。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-03-16 03:41

不是非常理解。k-means的话,单独算和一起算,没有区别吧?k-medoids的话,既然距离是自定义的,为什么就一定是median呢? - kykix   2018-03-16 07:23


  相关讨论

K-MEANS初始点选择的问题

K Means初始点必须是样本中的点吗

通俗地解释c-means以及fuzzy c-means是什么意思

KMeans++是怎么选初始点的?

kernal kmeans是什么意思?和一般的kmeans的区别是什么?

kmeans可以做并行化计算达到加速效果吗?

Jenks和K Means在一维数据时,是不是等价的?

K-Means实现mini-batch online learning的原理是什么?

关于online KMeans步骤中成员更新分类的问题?

关于小批量K均值(mini-batch K Means)的问题

  随便看看

seaborn.distplot直方图的y轴的数值是什么意思?

在jupyter后台进程没有shutdown的notebook一直会占用内存吗?

除了PCA,还有什么降维的方法?

样本权重大小不同时,用什么分类算法比较合适?

pandas DataFrame中经常出现SettingWithCopyWarning