如何检验两个样本是同分布的?

  统计/机器学习 假设检验 概率分布    浏览次数: 4925
5

假如我有两个样本,有没有什么假设检验的方法可以判断这两个样本是否服从同一个概率分布?

 

Gakki   2017-05-02 08:33



   4个回答 
8

如果是非数值的样本(multinomial),那么可以用卡方检验。

如果是数值样本,可以用柯尔莫哥洛夫-斯摩洛夫检验(K-S test)。

SofaSofa数据科学社区 DS面经 问答 实战

MrMath   2017-05-03 11:24

5

Categorical的数据:用卡方检验

Numerical的数据:用KS

Binary的数据:用T test

SofaSofa数据科学社区 DS面经 问答 实战

道画师   2017-09-18 21:09

2

提一个我目前正在看而且比较冷门的吧,Wasserstein distance. 

我觉得挺有帮助的参考文章有 Wasserstein GAN and the Kantorovich-Rubinstein Duality 还有 stackExchange上面这个问题Kullback-Leibler distance for comparing two distribution from sample points (原本以为KL divergence也可以的但是看了这个之后就有些犹豫了就不说出来了hhh)

SofaSofa数据科学社区 DS面经 问答 实战

aragakiyuii   2018-11-06 17:53

-2

说一个不用假设检验的“野路子”,对于数值的概率分布,把两个分布的累积分布函数的曲线画出来,然后求两个曲线的距离(L1或者L2)。人为设置一个阈值,小于它就说明它们两条曲线够接近,分布够相似。


SofaSofa数据科学社区 DS面经 问答 实战

桐桐酱   2017-10-14 07:14



  相关主题

怎么判断一个概率分布是对称的?   3回答

E-test是什么意思?   3回答

单样本T检验的自由度为什么是n-1?   1回答

方差分析的多重比较校正   1回答

python里Z-score和P-value相互转换   1回答

python中实现柯尔莫可洛夫-斯米洛夫检验(K-S test)   1回答

线性回归因变量y不满足正态性假设   1回答

python里怎么画QQ图?   1回答

单侧T检验p值与双侧T检验p值的关系   1回答

多重检验中的FDR(false discovery rate, 错误发现率)是什么?   2回答

t检验,需要测试集验证集吗?   3回答

假设检验中的p值是什么意思?为什么越小越好?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!