关于K均值聚类的权重问题

  统计/机器学习 无监督学习 特征选择    浏览次数: 394
0

K均值聚类的时候可以设置某个变量的权重大点么?

因为知道数据集变量的真实意义,我是想主要根据这个变量的不同进行聚类。


 

吴昊通   2018-02-18 11:16



   2个回答 
2

可以啊,你把这个你觉得重量的变量缩放到[-k, k]的维度上,其他变量缩放到[-1, 1]的维度上,至于k多大,就看你觉得到底那个变量有多重要了。


Lydia   2018-02-20 08:09

1

把不重要的变量压缩,把重要的变量拉伸,这样应该就可以了


Beck   2018-02-23 09:57



  相关主题

python使用MFCC特征训练GMMHMM模型   2回答

对于组合特征怎么理解?   1回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

partial dependence是什么意思?   0回答

AIC可以是负数吗?   1回答

在进行数值编码时出现错误,怎么解决?   1回答

python中如何产生交互项?   0回答

训练样本中每个维度是否独立对回归结果的影响   2回答

随机森林每次用多少个特征?   2回答

对于数值特征,决策树是如何决定阈值的?   3回答

对于树模型,需不需要特征筛选   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!