在分类问题中,有什么方法可以得到特征的重要性?

  统计/机器学习 监督式学习 特征选择    浏览次数:6794        分享
3

在分类问题中,有什么方法可以得到特征的重要性?重要性的意思就是对模型的预测具有重要的帮助。


谢谢!

 

开门呀是我   2017-05-07 11:34



   2个回答 
6

我知道的有三个思路。

一、通过随机森林,获取每个特征的importance,这个一般在python或者r里都是可以直接得到的数值。相似的gradient boosted trees或者xgboost也都有这样的importance。


二、单个特征。用单个特征建立分类器(比如,决策树,或者逻辑回归),哪个特征的模型越好,说明这个特征越重要。


三、向后选择。先用全部特征建立个分类器,然后把某个特征去掉,再做一个分类器,两个分类器表现的差值,就可以看作是这个特征的重要性。差值越大,说明越重要。


SofaSofa数据科学社区DS面试题库 DS面经

batmanX   2017-06-12 09:28

0

对于逻辑回归分类器的话,就是看每个变量的系数,绝对值越大,说明越重要。

(变量需要标准化)


SofaSofa数据科学社区DS面试题库 DS面经

Alfred   2017-10-16 12:04



  相关讨论

shap值为负是什么意思,可以删掉的意思吗

使用uci的社区犯罪率做回归,怎么选择因变量呢

partial dependence是什么意思?

SHAP可以解释二元分类模型吗?

不同模型下的特征重要性是不同的吗?

特征组合的重要性排序

分类问题 特征怎么选择

wrapper特征选择法是什么意思?

什么情况下需要做特征选择?

对于组合特征怎么理解?

  随便看看

为啥Xgboost比GradientBoost好那么多?

请问在sklearn怎么在已有的模型的基础上训练新的数据?

dropout rate一般设置多大?

如何在numpy array尾部增加一行

python里怎么表示科学计数法?