关于方差和偏差和噪声

  统计/机器学习 监督式学习    浏览次数: 99
0

问个问题 求大神告知

这里的 yD 和 y 的区别是什么?我们的数据集不是只有一个标签的吗?


还有关于方差和偏差

我们令

y_i 是第i行数据真实标签

y_pred_i 是第i行数据预测标签,mean_y_pred是所有预测值的均值

我们知道方差是针对一个数据集的,那么 方差是所有预测值数据集的方差吗?

就是说 方差=sum((y_pred_i-mean_y_pred))/n   i从1->n  吗?

然后偏差是针对数据集的还是针对单个数据实例的?

就是说 第i行数据的偏差=(mean_y_pred-y_i)^2 ?

还是说 所有数据的偏差=sum((mean_y_pred-y_i)^2)/n ?

然后噪声又是怎么求的?机器学习书上的噪声是 (yD-y)^2/n    这里的yD和y就是我上面提问的,不是一样的嘛?

 

a651021213   2018-10-13 14:27



   1个回答 
0

你截图里的$y_D$应该是观测值,$y$是真实值,具体的前后文不知道,我觉得应该是有观测误差,所以$y$和$y_D$不一定相等。


一般偏差是指总体的均值和预测的均值的差,假设$y_i$是真值,$\hat y_i$是预测值,偏差的式子为

$$\sum_{i=1}^n\frac{y_i-\hat y_i}{n}$$

你说的方差是

$$\sum_{i=1}^n\frac{(\hat y_i-\text{mean}(\hat y))^2}{n-1}$$

SofaSofa数据科学社区 DS面经 问答 实战

MangoCoke   2018-10-14 09:57



  相关主题

adaboost里的learning rate是什么意思?   1回答

SVM里的软间隔是什么意思   2回答

有序多分类问题   2回答

线性可分是什么意思?   1回答

SVM的支持向量最少有几个?   1回答

支持向量机(SVM)里的支持向量是什么意思   6回答

kNN的k=1为什么训练误差为0?   4回答

欠采样后概率还原问题   2回答

k-NN的k取1会怎么样   4回答

为什么说knn是惰性算法   1回答

knn推导过程中的一个细节   2回答

python里如何实现线性判别分析(LDA)?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!