欠采样后概率还原问题

  统计/机器学习 监督式学习
0

我有个非平衡的二元分类问题,0和1的比例是1比7左右。因为数据量不少,所以我对1进行了欠采样,随机取了1/7的1。

欠采样之后,0和1的比例基本上就是1:1了。问题是,根据这个样本进行训练的模型,作用在测试集上,测试集的概率都偏大了,按道理概率的平均值是0.125,结果是0.5。这个应该是和欠采样有关的。

有什么办法对这个进行修正吗?

 

大王来巡山   2017-05-28 23:42



    还没有回答。我来答!  


相关问题

线性可分是什么意思?   1回答

支持向量机(SVM)里的支持向量是什么意思   2回答

adaboost里的learning rate是什么意思?   1回答

knn推导过程中的一个细节   1回答

k-NN的k取1会怎么样   2回答

可以对线性回归进行boosting吗?   2回答

线性回归的bagging   2回答

逻辑回归的前提假设是什么?   1回答

什么时候该用LASSO,什么时候该用Ridge?   2回答

多元分类的混淆矩阵   1回答

kNN算法有哪些缺点?   2回答

二元分类问题中经常提到的TP,TF,FN,FP都是什么意思?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!