我看到K Means算法有哪些缺陷、劣势?这个里面的回答说:
- K means对样本的输入顺序比较敏感
- K means对数值特征的缩放也非常敏感
我想知道为什么K均值算法对样本的输入顺序比较敏感?这个敏感体现在什么方面?
2个回答
估计说的是用了online-learning策略的变异kmeans算法。原始的静态kmeans对输入顺序不敏感,静态指训练数据固定。SofaSofa数据科学社区DS面试题库 DS面经
谢谢,我认同你说的,应该顺序不影响结果
-
huanx8t
2018-10-07 11:01
对正常的K-means,或者说batch K-means,样本的顺序肯定是不会对结果有影响的,甚至中间步骤的结果也是没有影响的。
SofaSofa数据科学社区DS面试题库 DS面经
谢谢,我认同你说的,应该顺序不影响结果
-
huanx8t
2018-10-07 11:02