当数据量很小的时候,怎么做模型验证?

  统计/机器学习 监督式学习 模型验证 开放问题    浏览次数: 218
1

当数据量很小的时候,怎么做模型验证?

是用留一法验证还是交叉验证呢?


我另一个相关问题:哪些机器学习分类模型适用于小数据?

 

超越本人   2018-09-19 13:35



   1个回答 
3

当数据很少的时候,就必须得充分利用数据了,所以更推荐用交叉验证。但是交叉验证只能用来估计误差,而不能用来调参,因为一旦用来调参就很容易过拟合。

另外k-fold交叉验证时,k不能选太大,对于小数据集而言,k取3或者4就足够了。

SofaSofa数据科学社区 DS面经 问答 实战

Lydia   2018-09-20 13:05



  相关主题

训练误差、测试误差、泛化误差的区别   2回答

模型调参时常用到的Grid Search是什么意思?   3回答

多元分类的混淆矩阵   1回答

F1值会受到不平衡数据的影响吗?   2回答

二元分类问题中经常提到的TP,TN,FN,FP都是什么意思?   3回答

什么是混淆矩阵(confusion matrix)   2回答

precision-recall曲线下面积有什么意义?   3回答

利用交叉验证调参后还需要用完整的数据集重新训练吗?   2回答

机器学习里的ppv是什么意思?   1回答

k近邻算法(k-NN)怎么选k   2回答

用python求二元分类的混淆矩阵   2回答

k-fold cross validation的k怎么选   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!