K Means算法有哪些缺陷、劣势?

  统计/机器学习 无监督学习 开放问题    浏览次数: 284
3

K Means算法的一个明显缺陷就是,那么还有哪些缺陷和劣势呢?


 

nzsfw   2018-09-02 12:26



   4个回答 
8
  • K-Means计算量大,速度慢
  • K -Means对迭代初始点的选择比较敏感,容易陷入局部最小值
  • K-Means对高维数据表现不佳(慢,高维数据容易稀疏)
  • K-Means对categorical feature不能直接处理

sasa   2018-09-04 02:13

5
补充一下
  • K-Means的K有时候很难确定(K-means中如何选K
  • 不能返回概率值,只能返回每个样本的标签

蘑菇蘑菇   2018-09-04 10:20

4

补充一下

  • K-means只能聚球状数据点
  • K-means对离群点/异常点敏感,需要先做异常点检测

Tyyu   2018-09-04 18:08

2
  • K means对样本的输入顺序比较敏感
  • K means对数值特征的缩放也非常敏感

K means和Knn在模型上有一些共性,所以缺点也类型。可以额外阅读以下:kNN算法有哪些缺点?

数据科学小K   2018-09-11 13:38



  相关主题

kNN算法有哪些缺点?   6回答

决策树有哪些缺点?   2回答

在使用PCA降维时,有哪些坑?   6回答

二分法K Means的算法是什么?和普通的K Means有什么区别?   2回答

K-means怎么选K?   6回答

关于小批量K均值(mini-batch K Means)的问题   2回答

通俗地解释c-means以及fuzzy c-means是什么意思   1回答

k-medoids和k-means区别   3回答

如何用K Means做异常点检测?   1回答

K Means初始点必须是样本中的点吗   2回答

Jenks和K Means在一维数据时,是不是等价的?   2回答

K-MEANS初始点选择的问题   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!