K Means算法有哪些缺陷、劣势?

  统计/机器学习 无监督学习 开放问题    浏览次数:2989        分享
3

K Means算法的一个明显缺陷就是,那么还有哪些缺陷和劣势呢?


 

nzsfw   2018-09-02 12:26



   5个回答 
15
  • K-Means计算量大,速度慢
  • K -Means对迭代初始点的选择比较敏感,容易陷入局部最小值
  • K-Means对高维数据表现不佳(慢,高维数据容易稀疏)
  • K-Means对categorical feature不能直接处理
SofaSofa数据科学社区DS面试题库 DS面经

sasa   2018-09-04 02:13

10

补充一下

  • K-means只能聚球状数据点
  • K-means对离群点/异常点敏感,需要先做异常点检测
SofaSofa数据科学社区DS面试题库 DS面经

Tyyu   2018-09-04 18:08

9
补充一下
  • K-Means的K有时候很难确定(K-means中如何选K
  • 不能返回概率值,只能返回每个样本的标签
SofaSofa数据科学社区DS面试题库 DS面经

蘑菇蘑菇   2018-09-04 10:20

3
  • K means对样本的输入顺序比较敏感
  • K means对数值特征的缩放也非常敏感

K means和Knn在模型上有一些共性,所以缺点也类型。可以额外阅读以下:kNN算法有哪些缺点? 


-----------补充一下------------

我上面说的第二点不是很准确,因为对于batch K Means,顺序是不影响结果的。

感谢各位的讨论,为什么K Means算法对样本的输入顺序比较敏感?

SofaSofa数据科学社区DS面试题库 DS面经

数据科学小K   2018-09-11 13:38

已更新,谢谢提醒 - 数据科学小K   2018-10-10 14:20
0

我也是感觉k均值算法在数据大的时候特别慢,而且每次跑下来的结果可能也不大一样。

初学者,如果有说错的还请包涵指教~

SofaSofa数据科学社区DS面试题库 DS面经

R琳   2019-05-07 13:21



  相关主题

tsne被忽视?tsne有什么缺点?   3回答

kNN算法有哪些缺点?   6回答

二阶优化算法比一阶的优化算法比有什么优缺点?   2回答

决策树有哪些缺点?   2回答

相比xgboost,GBDT有什么优势   3回答

最小二乘法与最小二乘支持向量回归的优劣   4回答

激活函数ReLU和Sigmoid的优劣对比   4回答

随机森林(random forest)和支持向量机(SVM)各有什么优劣   1回答

在使用PCA降维时,有哪些坑?   6回答

坐标下降法和最小角回归求取L1范数正则化问题时的优劣?   1回答

kernal kmeans是什么意思?和一般的kmeans的区别是什么?   0回答

如何用K Means做异常检测(outlier anomaly detection)?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!