全部问题问题热门未解答所有标签标签收藏收藏我要提问

K Means初始点必须是样本中的点吗

统计/机器学习无监督学习浏览次数：5022 分享

二维码

手机扫描二维码

面试中常见简答题？

K Means初始点是随机的，那么必须是样本中的点吗？还是根据数值的范围，用Uniform分布产生的随机点？

杨业勇 2018-06-21 08:20

2个回答

不一定是样本中的点，但是为了方便，通常选样本中的作为初始的中心点，但是经过一次迭代之后，中心点一般就不是样本中的点了。

SofaSofa数据科学社区 DS面试题库 DS面经

曾经是科比 2018-06-21 10:24

最好用样本中的点。因为存在就合理，用没见过的值，会有风险。举个极端的例子。比如数据范围是[0,1]，如果出现一个异常点是10000，那么初始值是uniform[0,10000]的随机数,会很难收敛。如果用样本中的点做初始值，只有很小概率会用这个异常点。

SofaSofa数据科学社区 DS面试题库 DS面经

Zealing 2018-06-22 09:16

相关讨论

通俗地解释c-means以及fuzzy c-means是什么意思

关于online KMeans步骤中成员更新分类的问题？

K-MEANS初始点选择的问题

kmeans可以用在三维数据上吗？

k-medoids和k-means区别

KMeans++是怎么选初始点的？

关于小批量K均值（mini-batch K Means）的问题

K-Means实现mini-batch online learning的原理是什么？

Jenks和K Means在一维数据时，是不是等价的？

kmeans可以做并行化计算达到加速效果吗？

随便看看

matplotlib画图怎么确保横坐标和纵坐标的单位长度一致？

多重检验中的FDR(false discovery rate, 错误发现率)是什么？

pandas.DataFrame更改列名

matplotlib一个画板上多个图叠加，如何决定图层上下？

分类变量，进行One hot编码，维度升高，如何处理？