线下训练集和测试集防过拟合

  统计/机器学习 监督式学习 模型验证    浏览次数:683        分享
1

有没有什么好的算法,能够有效地算出过拟合的临界点呢?

 

mantora   2018-02-02 15:35



   1个回答 
1

hyperparameter的临界点?

用cross validation吧


SofaSofa数据科学社区DS面试题库 DS面经

sasa   2018-02-03 02:15

你说的是这个吧cross_val_score(XGB,train,y_train,cv=5,scoring='neg_mean_squared_error'),可是线下和线上有时候会差好多啊 - mantora   2018-02-03 13:14


  相关主题

训练集加入噪声防止over fitting还是加剧overfitting?   3回答

为什么过拟合不好?   8回答

unsupervised learning也会over-fitting吗?   2回答

Random Forest 过拟合有什么好办法?   3回答

决策树模型有什么特点以及如何防止过拟合?   2回答

随机森林会发生过拟合(overfitting)吗?   2回答

xgboost是如何实现early stopping防止过拟合的?   1回答

为什么正则项通常都是用L1或者L2,而不是其他的?   2回答

L0 norm 正则是什么意思?   2回答

最小角回归是天然的LASSO化?正则化参数怎么体现?   3回答

正则项里的L1,L2是什么意思?   1回答

如何理解“迭代步骤本身就是一个正则化的过程”   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!