k-fold cross validation的k怎么选

  统计/机器学习 模型验证    浏览次数:6633        分享
1

k一般是怎么选?这方面的资料很难找到。

谢谢!

 

机器小白   2017-04-03 10:04



   3个回答 
9

如果k取得比较小,比如2,3,4,可能偏差会比较大。

如果k取得比较大,比如20,30,会特别费时间。

我通常一般取5到10之间的数。

如果cross validation的结果对你很重要,你愿意花时间去做的话,我推荐可以做多次cross validation。因为k-fold cross validation中每个fold的validation error不是独立的。比如说,你可以先做5-fold cross validation,然后重新随机划分,再重复4次5-fold cross validation。

SofaSofa数据科学社区DS面试题库 DS面经

起个好名字   2017-04-04 10:02

6

一般都是随便设定的哈,3到10都可以吧。因为cross validation本身就是用来选模型参数的,再花大功夫选k是不是显得有点多此一举?我个人都是设定fold=5

SofaSofa数据科学社区DS面试题库 DS面经

二八骚年   2017-04-12 11:38

2

如果数据量很大的话,k的选择就不那么重要了,甚至做train test split就足够了

SofaSofa数据科学社区DS面试题库 DS面经

GuoLinhui   2018-11-17 12:30



  相关讨论

如何在保持查全率不变的情况下提高查准率?

Stratified k-fold cross validation(分层交叉验证)

精度-召回曲线的起点和终点是什么?

如果我用交叉验证,还是否需要单独分出测试集?

回归问题中的stratified cross validation?

交叉验证是如何进行的?

K折交叉验证是否有意义?

十折交叉验证

测试集和验证集的区别?

micro和macro F1 score分别是什么意思?

  随便看看

向量梯度下降优化的最佳步长?

numpy.array转换为图片并显示出来

怎么利用permutation importance来解释xgboost模型的特征?

deep learning中的pooling是什么意思?

Python计算两个数组的相关系数