在分类问题中,有什么方法可以得到特征的重要性?重要性的意思就是对模型的预测具有重要的帮助。
谢谢!
2个回答
我知道的有三个思路。
一、通过随机森林,获取每个特征的importance,这个一般在python或者r里都是可以直接得到的数值。相似的gradient boosted trees或者xgboost也都有这样的importance。
二、单个特征。用单个特征建立分类器(比如,决策树,或者逻辑回归),哪个特征的模型越好,说明这个特征越重要。
三、向后选择。先用全部特征建立个分类器,然后把某个特征去掉,再做一个分类器,两个分类器表现的差值,就可以看作是这个特征的重要性。差值越大,说明越重要。
相关主题
SHAP可以解释二元分类模型吗?
1回答
特征组合的重要性排序
1回答
分类问题 特征怎么选择
1回答
对于组合特征怎么理解?
1回答
什么情况下需要做特征选择?
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!