KMeans++是怎么选初始点的?

  统计/机器学习 无监督学习    浏览次数:120        分享
1

KMeans++是Kmeans的改进,改进的地方主要是在选初始点,但是没有搞明白到底是怎么选初始点的?

谢谢!

 

John雄   2019-09-04 07:40



   1个回答 
5

根据Kmeans++

先随机选一点作为$C_1$;

$D(x_i)=|x_i-C_1|^2$, $D(x_i)$越大,有更大概率被选为下一个中心点$C_2$;

$D(x_i)=min({|x_i-C_k|^2}), k=1,2$,$D(x_i)$越大,有更大概率被选为下一个中心点$C_3$;

...

直到选出$C_K$。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2019-09-05 00:24



  相关主题

k-medoids和k-means区别   3回答

为什么K Means算法对样本的输入顺序比较敏感?   2回答

二分法K Means的算法是什么?和普通的K Means有什么区别?   2回答

K-means怎么选K?   6回答

关于online KMeans步骤中成员更新分类的问题?   1回答

K-Means实现mini-batch online learning的原理是什么?   1回答

如何用K Means做异常检测(outlier anomaly detection)?   3回答

关于小批量K均值(mini-batch K Means)的问题   3回答

通俗地解释c-means以及fuzzy c-means是什么意思   1回答

K means对数据的分布有要求吗?需要符合哪些前提假设?   4回答

特征归一化对K Means有影响吗?   3回答

K Means初始点必须是样本中的点吗   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!