K Means算法有哪些缺陷、劣势?

  统计/机器学习 无监督学习 开放问题    浏览次数: 442
3

K Means算法的一个明显缺陷就是,那么还有哪些缺陷和劣势呢?


 

nzsfw   2018-09-02 12:26



   4个回答 
10
  • K-Means计算量大,速度慢
  • K -Means对迭代初始点的选择比较敏感,容易陷入局部最小值
  • K-Means对高维数据表现不佳(慢,高维数据容易稀疏)
  • K-Means对categorical feature不能直接处理
SofaSofa数据科学社区 DS面经 问答 实战

sasa   2018-09-04 02:13

7
补充一下
  • K-Means的K有时候很难确定(K-means中如何选K
  • 不能返回概率值,只能返回每个样本的标签
SofaSofa数据科学社区 DS面经 问答 实战

蘑菇蘑菇   2018-09-04 10:20

6

补充一下

  • K-means只能聚球状数据点
  • K-means对离群点/异常点敏感,需要先做异常点检测
SofaSofa数据科学社区 DS面经 问答 实战

Tyyu   2018-09-04 18:08

1
  • K means对样本的输入顺序比较敏感
  • K means对数值特征的缩放也非常敏感

K means和Knn在模型上有一些共性,所以缺点也类型。可以额外阅读以下:kNN算法有哪些缺点? 


-----------补充一下------------

我上面说的第二点不是很准确,因为对于batch K Means,顺序是不影响结果的。

感谢各位的讨论,为什么K Means算法对样本的输入顺序比较敏感?

SofaSofa数据科学社区 DS面经 问答 实战

数据科学小K   2018-09-11 13:38

已更新,谢谢提醒 - 数据科学小K   2018-10-10 14:20


  相关主题

kNN算法有哪些缺点?   6回答

最小二乘法与最小二乘支持向量回归的优劣   4回答

决策树有哪些缺点?   2回答

随机森林(random forest)和支持向量机(SVM)各有什么优劣   1回答

相比xgboost,GBDT有什么优势   2回答

二阶优化算法比一阶的优化算法比有什么优缺点?   0回答

在使用PCA降维时,有哪些坑?   6回答

激活函数ReLU和Sigmoid的优劣对比   4回答

K-means怎么选K?   6回答

为什么K Means算法对样本的输入顺序比较敏感?   2回答

二分法K Means的算法是什么?和普通的K Means有什么区别?   2回答

通俗地解释c-means以及fuzzy c-means是什么意思   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!