学习曲线异常分析

  统计/机器学习 模型验证    浏览次数:421        分享
0

1,以下是用分别用逻辑回归与神经网络得出的学习曲线,通过sklearn learning_curve 方法获取并画出的图。这个图有点奇怪,为什么train dataset和cv dataset都是一个方向并且比较一致的?请高手帮忙分析一下,如下图:


2,这两个模型通过测试数据得出的相关评价指标都比较高的,如下:


 

leo   2020-02-20 12:16



   1个回答 
0

你的train_size是什么意思?

在训练刚开始的时候方向一致是很正常的,根据你的图里来看,两个模型可能都还在欠拟合的阶段,所以training accuracy和cv accuracy都是在上升。一般来说t随着训练次数增加,模型会从欠拟合状态变为过拟合的状态,这个过程中train的accuracy会持续上升,而cv的accuracy会在某个点之后开始下降,开始下降的这个点就是这个模型的最优状态。

SofaSofa数据科学社区DS面试题库 DS面经

kidd23   2020-02-23 16:12



  相关主题

micro和macro F1 score分别是什么意思?   2回答

精度-召回曲线的起点和终点是什么?   2回答

如何在保持查全率不变的情况下提高查准率?   1回答

k-fold cross validation的k怎么选   3回答

测试集和验证集的区别?   4回答

交叉验证是如何进行的?   2回答

回归问题中的stratified cross validation?   2回答

十折交叉验证   1回答

Stratified k-fold cross validation(分层交叉验证)   1回答

如果我用交叉验证,还是否需要单独分出测试集?   1回答

python里怎么求多元分类的F1 score?   1回答

precision-recall曲线下面积有什么意义?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!