K Means算法有哪些缺陷、劣势?

  统计/机器学习 无监督学习 开放问题    浏览次数:5235        分享
3

K Means算法的一个明显缺陷就是,那么还有哪些缺陷和劣势呢?


 

nzsfw   2018-09-02 12:26



   5个回答 
15
  • K-Means计算量大,速度慢
  • K -Means对迭代初始点的选择比较敏感,容易陷入局部最小值
  • K-Means对高维数据表现不佳(慢,高维数据容易稀疏)
  • K-Means对categorical feature不能直接处理
SofaSofa数据科学社区DS面试题库 DS面经

sasa   2018-09-04 02:13

10

补充一下

  • K-means只能聚球状数据点
  • K-means对离群点/异常点敏感,需要先做异常点检测
SofaSofa数据科学社区DS面试题库 DS面经

Tyyu   2018-09-04 18:08

9
补充一下
  • K-Means的K有时候很难确定(K-means中如何选K
  • 不能返回概率值,只能返回每个样本的标签
SofaSofa数据科学社区DS面试题库 DS面经

蘑菇蘑菇   2018-09-04 10:20

3
  • K means对样本的输入顺序比较敏感
  • K means对数值特征的缩放也非常敏感

K means和Knn在模型上有一些共性,所以缺点也类型。可以额外阅读以下:kNN算法有哪些缺点? 


-----------补充一下------------

我上面说的第二点不是很准确,因为对于batch K Means,顺序是不影响结果的。

感谢各位的讨论,为什么K Means算法对样本的输入顺序比较敏感?

SofaSofa数据科学社区DS面试题库 DS面经

数据科学小K   2018-09-11 13:38

已更新,谢谢提醒 - 数据科学小K   2018-10-10 14:20
0

我也是感觉k均值算法在数据大的时候特别慢,而且每次跑下来的结果可能也不大一样。

初学者,如果有说错的还请包涵指教~

SofaSofa数据科学社区DS面试题库 DS面经

R琳   2019-05-07 13:21



  相关讨论

kNN算法有哪些缺点?

tsne被忽视?tsne有什么缺点?

决策树有哪些缺点?

为什么K Means算法对样本的输入顺序比较敏感?

K-means怎么选K?

二分法K Means的算法是什么?和普通的K Means有什么区别?

在使用PCA降维时,有哪些坑?

最小二乘法与最小二乘支持向量回归的优劣

特征归一化对K Means有影响吗?

kmeans可以做并行化计算达到加速效果吗?

  随便看看

plt.bar怎么设置每个bar的颜色?

numpy.array从行向量转为列向量

凸函数、凸集分别是什么意思?

pip install opencv-python失败,难道非要编译安装?

逻辑回归的损失函数是怎么来的