stratified cross validation对于分类问题,是按照标签比例生成每个fold,使得每个fold中标签的比例都是和原数据集一样的。那么回归问题怎么处理?如何按照比例?按照什么比例?
2个回答
可能这个问题还没定论,根据sklearn中的StratifiedKFold也尚未实现针对于回归问题的Stratified Cross Validation。
一种比较合理的能够实现Stratified Cross Validation的方法是对所有真实值按照四等分点分成四份,然后从这四等分的子集中随机划分K组,再将它们重新组合,成为那K个fold的数据集。这样能保证每个fold中真值的分布比较接近。
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
Stratified k-fold cross validation(分层交叉验证)
1回答
学习曲线异常分析
1回答
交叉验证是如何进行的?
2回答
十折交叉验证
1回答
测试集和验证集的区别?
4回答
micro和macro F1 score分别是什么意思?
2回答
k-fold cross validation的k怎么选
3回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!