k-fold cross validation的k怎么选

  统计/机器学习 模型验证    浏览次数:2029        分享
1

k一般是怎么选?这方面的资料很难找到。

谢谢!

 

机器小白   2017-04-03 10:04



   3个回答 
9

如果k取得比较小,比如2,3,4,可能偏差会比较大。

如果k取得比较大,比如20,30,会特别费时间。

我通常一般取5到10之间的数。

如果cross validation的结果对你很重要,你愿意花时间去做的话,我推荐可以做多次cross validation。因为k-fold cross validation中每个fold的validation error不是独立的。比如说,你可以先做5-fold cross validation,然后重新随机划分,再重复4次5-fold cross validation。

SofaSofa数据科学社区DS面试题库 DS面经

起个好名字   2017-04-04 10:02

6

一般都是随便设定的哈,3到10都可以吧。因为cross validation本身就是用来选模型参数的,再花大功夫选k是不是显得有点多此一举?我个人都是设定fold=5

SofaSofa数据科学社区DS面试题库 DS面经

二八骚年   2017-04-12 11:38

2

如果数据量很大的话,k的选择就不那么重要了,甚至做train test split就足够了

SofaSofa数据科学社区DS面试题库 DS面经

GuoLinhui   2018-11-17 12:30



  相关主题

micro和macro F1 score分别是什么意思?   2回答

如果我用交叉验证,还是否需要单独分出测试集?   1回答

回归问题中的stratified cross validation?   2回答

十折交叉验证   1回答

测试集和验证集的区别?   4回答

交叉验证是如何进行的?   2回答

如何在保持查全率不变的情况下提高查准率?   1回答

精度-召回曲线的起点和终点是什么?   2回答

Stratified k-fold cross validation(分层交叉验证)   1回答

python里怎么求多元分类的F1 score?   1回答

precision-recall曲线下面积有什么意义?   3回答

多元分类问题有没有F1?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!