我在同样的一个数据集上用了三个不同的模型,分别是逻辑回归,随机森林,Xgboost。
我用回归系数的绝对值大小表示特征在逻辑回归中的重要性,用feature importance表示随机森林和Xgb里特征的重要性。
但是发现这三个模型中最重要的前十个特征并不相同,这是为什么呢?我该用哪个模型的特征重要性呢?
1个回答
1. 建议你贴出来三种模型得到的最重要特征, 它们是完全没有重合还是有部分重合?便于接下来分析;
2. 按理说,重要的特征应该是相同的,你可以做一下PCA;
3. 这三种模型的表现怎么样?会不会逻辑回归很差?
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
SHAP可以解释二元分类模型吗?
1回答
特征组合的重要性排序
1回答
分类问题 特征怎么选择
1回答
什么情况下需要做特征选择?
1回答
对于组合特征怎么理解?
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!