在分类问题中,有什么方法可以得到特征的重要性?

  统计/机器学习 监督式学习 特征选择    浏览次数: 648
3

在分类问题中,有什么方法可以得到特征的重要性?重要性的意思就是对模型的预测具有重要的帮助。


谢谢!

 

开门呀是我   2017-05-07 11:34



   2个回答 
6

我知道的有三个思路。

一、通过随机森林,获取每个特征的importance,这个一般在python或者r里都是可以直接得到的数值。相似的gradient boosted trees或者xgboost也都有这样的importance。


二、单个特征。用单个特征建立分类器(比如,决策树,或者逻辑回归),哪个特征的模型越好,说明这个特征越重要。


三、向后选择。先用全部特征建立个分类器,然后把某个特征去掉,再做一个分类器,两个分类器表现的差值,就可以看作是这个特征的重要性。差值越大,说明越重要。


batmanX   2017-06-12 09:28

0

对于逻辑回归分类器的话,就是看每个变量的系数,绝对值越大,说明越重要。

(变量需要标准化)


Alfred   2017-10-16 12:04



  相关主题

对于组合特征怎么理解?   1回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

AIC可以是负数吗?   1回答

python使用MFCC特征训练GMMHMM模型   2回答

关于K均值聚类的权重问题   2回答

随机森林每次用多少个特征?   2回答

对于树模型,需不需要特征筛选   1回答

对于数值特征,决策树是如何决定阈值的?   3回答

怎么理解决策树是模型自己在做interaction?   1回答

随机森林给出的变量的Importantce是怎么来的   1回答

gbdt如何对连续特征离散化   1回答

回归树是以什么标准来选特征的?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!