为什么K Means算法对样本的输入顺序比较敏感?

  统计/机器学习 无监督学习 开放问题    浏览次数:6239        分享
1

我看到K Means算法有哪些缺陷、劣势?这个里面的回答说:

  • K means对样本的输入顺序比较敏感
  • K means对数值特征的缩放也非常敏感

我想知道为什么K均值算法对样本的输入顺序比较敏感?这个敏感体现在什么方面?

 

huanx8t   2018-10-04 14:52



   2个回答 
5
估计说的是用了online-learning策略的变异kmeans算法。原始的静态kmeans对输入顺序不敏感,静态指训练数据固定。SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-10-04 17:41

谢谢,我认同你说的,应该顺序不影响结果 - huanx8t   2018-10-07 11:01
4

对正常的K-means,或者说batch K-means,样本的顺序肯定是不会对结果有影响的,甚至中间步骤的结果也是没有影响的。

SofaSofa数据科学社区DS面试题库 DS面经

zl_pku   2018-10-05 08:12

谢谢,我认同你说的,应该顺序不影响结果 - huanx8t   2018-10-07 11:02


  相关讨论

K-means怎么选K?

二分法K Means的算法是什么?和普通的K Means有什么区别?

Jenks和K Means在一维数据时,是不是等价的?

k-medoids和k-means区别

通俗地解释c-means以及fuzzy c-means是什么意思

K Means初始点必须是样本中的点吗

kmeans可以做并行化计算达到加速效果吗?

特征归一化对K Means有影响吗?

kmeans可以用在三维数据上吗?

K-MEANS初始点选择的问题

  随便看看

医学统计里的c-index或者c-statistic是什么意思?

numpy里生成单位矩阵?

95%置信区间的正确理解

二维numpy.array转为一维的numpy.array或者list

sklearn训练classifier的时候报错Unknown label type