如何检验两个样本是同分布的?

  统计/机器学习 假设检验 概率分布    浏览次数:19275        分享

假如我有两个样本,有没有什么假设检验的方法可以判断这两个样本是否服从同一个概率分布?

 

Gakki   2017-05-02 08:33



   4个回答 
12

如果是非数值的样本(multinomial),那么可以用卡方检验。

如果是数值样本,可以用柯尔莫哥洛夫-斯摩洛夫检验(K-S test)。

SofaSofa数据科学社区DS面试题库 DS面经

MrMath   2017-05-03 11:24

8

Categorical的数据:用卡方检验

Numerical的数据:用KS

Binary的数据:用T test

SofaSofa数据科学社区DS面试题库 DS面经

道画师   2017-09-18 21:09

Binary的数据也可以用$\chi^2$ - LiShanfei   2018-12-18 02:06
3

提一个我目前正在看而且比较冷门的吧,Wasserstein distance. 

我觉得挺有帮助的参考文章有 Wasserstein GAN and the Kantorovich-Rubinstein Duality 还有 stackExchange上面这个问题Kullback-Leibler distance for comparing two distribution from sample points (原本以为KL divergence也可以的但是看了这个之后就有些犹豫了就不说出来了hhh)

SofaSofa数据科学社区DS面试题库 DS面经

aragakiyuii   2018-11-06 17:53

对的,KL是不对称的;Jensen–Shannon divergence是对称的 - 黑泽先生   2022-06-16 08:27
-3

说一个不用假设检验的想法,对于数值的概率分布,把两个分布的累积分布函数的曲线画出来,然后求两个曲线的距离(L1或者L2)。人为设置一个阈值,小于它就说明它们两条曲线够接近,分布够相似。

SofaSofa数据科学社区DS面试题库 DS面经

桐桐酱   2017-10-14 07:14



  相关讨论

单样本T检验的自由度为什么是n-1?

怎么验证数据服从某个特定的泊松分布?

判断两个骰子是独立的?

求介绍一下Shapiro–Wilk test?

怎么判断一个概率分布是对称的?

方差分析的多重比较校正

E-test是什么意思?

python里Z-score和P-value相互转换

python中实现柯尔莫可洛夫-斯米洛夫检验(K-S test)

怎么判断两个线性回归模型是显著的不同?

  随便看看

如何调节seaborn里字体大小?

线性回归需要满足哪些基本前提假设

plt.scatter plot怎么让不同的类别有不同的颜色

deep learning中的pooling是什么意思?

sklearn分类模型中预测结果怎么调整概率的阈值