kmeans可以做并行化计算达到加速效果吗?

  统计/机器学习 无监督学习    浏览次数:3268        分享
0

kmeans可以做并行化计算达到加速效果吗?上周面试被问的题目,没什么思路,谢谢

 

楚湘白   2020-03-29 21:42



   3个回答 
3


SofaSofa数据科学社区DS面试题库 DS面经

公众号:AI深度视线   2020-03-31 11:12

这个dkmeans算法感觉和kmeans不完全等价。每次迭代的时候应该会随机重新选择主站吧 - 壬金   2020-04-11 23:26
1

可以并行。Kmeans分两步,第一步算n个点到k个中心的最小距离,数据点间计算不相关,可以用m个进程并行计算m个点的最小距离。第二步更新k个中心点时,要连续使用n个点数据,加法运算有顺序,不能并行。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2020-03-30 07:11

0

可以的,有分布式聚类算法DK-means

https://wenku.baidu.com/view/db713dd38e9951e79b8927a2.html

SofaSofa数据科学社区DS面试题库 DS面经

公众号:AI深度视线   2020-03-31 11:14



  相关讨论

K-Means实现mini-batch online learning的原理是什么?

KMeans++是怎么选初始点的?

kernal kmeans是什么意思?和一般的kmeans的区别是什么?

Jenks和K Means在一维数据时,是不是等价的?

关于online KMeans步骤中成员更新分类的问题?

k-medoids和k-means区别

通俗地解释c-means以及fuzzy c-means是什么意思

K-MEANS初始点选择的问题

kmeans可以用在三维数据上吗?

K Means初始点必须是样本中的点吗

  随便看看

plt.bar怎么设置每个bar的颜色?

推荐系统算法里的cold start是什么意思?

keras里sparse_categorical_crossentropy和categorical_crossentropy什么不同?

怎么按照设定概率产生不重复的随机排序?

tf.placeholder(tf.float32, shape=(None, 1024))中的None是什么意思