学习曲线异常分析

  统计/机器学习 模型验证    浏览次数:2160        分享
0

1,以下是用分别用逻辑回归与神经网络得出的学习曲线,通过sklearn learning_curve 方法获取并画出的图。这个图有点奇怪,为什么train dataset和cv dataset都是一个方向并且比较一致的?请高手帮忙分析一下,如下图:


2,这两个模型通过测试数据得出的相关评价指标都比较高的,如下:


 

leo   2020-02-20 12:16



   1个回答 
0

你的train_size是什么意思?

在训练刚开始的时候方向一致是很正常的,根据你的图里来看,两个模型可能都还在欠拟合的阶段,所以training accuracy和cv accuracy都是在上升。一般来说t随着训练次数增加,模型会从欠拟合状态变为过拟合的状态,这个过程中train的accuracy会持续上升,而cv的accuracy会在某个点之后开始下降,开始下降的这个点就是这个模型的最优状态。

SofaSofa数据科学社区DS面试题库 DS面经

kidd23   2020-02-23 16:12



  相关讨论

在训练前数据处理的时候,怎么剔除异常值?

单一变量下的异常检测该怎么做?

kNN用来做异常点检测?

如果不去掉异常值(outlier),会对线性回归模型有什么影响?

离群点、孤立点、异常点有什么区别吗?

如果数据不是正态分布,能用3sigma原则剔除异常值吗?

对于异常数据的判断?

如何用K Means做异常检测(outlier anomaly detection)?

auto-encoder异常检测的问题,无标签情况下怎么进行预测?

micro和macro F1 score分别是什么意思?

  随便看看

非方阵的逆是什么

怎么从矩母函数(mgf)推导得到概率密度函数(pdf)?

xgboost的gblinear是什么意思?

如何获取pyspark DataFrame的行数和列数?

为什么矩阵的二范数和向量的二范数的定义不同?