全部问题问题热门未解答所有标签标签收藏收藏我要提问

为什么K Means算法对样本的输入顺序比较敏感？

统计/机器学习无监督学习开放问题浏览次数：6239 分享

二维码

手机扫描二维码

机器学习面试也能刷题？

我看到K Means算法有哪些缺陷、劣势？这个里面的回答说：

K means对样本的输入顺序比较敏感
K means对数值特征的缩放也非常敏感

我想知道为什么K均值算法对样本的输入顺序比较敏感？这个敏感体现在什么方面？

huanx8t 2018-10-04 14:52

2个回答

估计说的是用了online-learning策略的变异kmeans算法。原始的静态kmeans对输入顺序不敏感，静态指训练数据固定。SofaSofa数据科学社区 DS面试题库 DS面经

Zealing 2018-10-04 17:41

谢谢，我认同你说的，应该顺序不影响结果 - huanx8t 2018-10-07 11:01

对正常的K-means，或者说batch K-means，样本的顺序肯定是不会对结果有影响的，甚至中间步骤的结果也是没有影响的。

SofaSofa数据科学社区 DS面试题库 DS面经

zl_pku 2018-10-05 08:12

谢谢，我认同你说的，应该顺序不影响结果 - huanx8t 2018-10-07 11:02

相关讨论

K-means怎么选K?

二分法K Means的算法是什么？和普通的K Means有什么区别？

Jenks和K Means在一维数据时，是不是等价的？

k-medoids和k-means区别

通俗地解释c-means以及fuzzy c-means是什么意思

K Means初始点必须是样本中的点吗

kmeans可以做并行化计算达到加速效果吗？

特征归一化对K Means有影响吗？

kmeans可以用在三维数据上吗？

K-MEANS初始点选择的问题

随便看看

医学统计里的c-index或者c-statistic是什么意思？

numpy里生成单位矩阵？

95%置信区间的正确理解

二维numpy.array转为一维的numpy.array或者list

sklearn训练classifier的时候报错Unknown label type