不同模型下的特征重要性是不同的吗?

  统计/机器学习 监督式学习 特征选择    浏览次数:242        分享
0

我在同样的一个数据集上用了三个不同的模型,分别是逻辑回归,随机森林,Xgboost。

我用回归系数的绝对值大小表示特征在逻辑回归中的重要性,用feature importance表示随机森林和Xgb里特征的重要性。

但是发现这三个模型中最重要的前十个特征并不相同,这是为什么呢?我该用哪个模型的特征重要性呢?

 

cannon   2020-08-26 10:28



   1个回答 
0

1. 建议你贴出来三种模型得到的最重要特征, 它们是完全没有重合还是有部分重合?便于接下来分析;

2. 按理说,重要的特征应该是相同的,你可以做一下PCA;

3. 这三种模型的表现怎么样?会不会逻辑回归很差?

SofaSofa数据科学社区DS面试题库 DS面经

anlijuncn   2020-09-02 16:49



  相关主题

partial dependence是什么意思?   1回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

使用uci的社区犯罪率做回归,怎么选择因变量呢   2回答

SHAP可以解释二元分类模型吗?   1回答

shap值为负是什么意思,可以删掉的意思吗   1回答

特征组合的重要性排序   1回答

分类问题 特征怎么选择   1回答

wrapper特征选择法是什么意思?   1回答

对于组合特征怎么理解?   1回答

什么情况下需要做特征选择?   1回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

如果一列特征有90%以上的数值都是0,这个特征还有用吗?   4回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!