如何度量一个分布长尾的程度?

  统计/机器学习 概率分布 描述性统计    浏览次数:1108        分享
0

如何度量一个长尾分布到底有多长,也就是比较两个长尾分布的长尾程度?有具体的公式可以计算吗?

 

小萌新   2020-03-04 21:29



   2个回答 
4

可以用峰度(Kurtosis)来表示长尾得程度,正态分布得峰度是3,如果一个分布的峰度大于3,你可以认为它是比正态分布更长尾的。

峰度的计算公式是根据四阶中心距和标准差得到的

$$\text{Kurtosis}=\frac{\frac{1}{n}\sum_{i=1}^n (x-\bar x)^4}{\sigma^4}$$

$\bar x$是样本中的均值

SofaSofa数据科学社区DS面试题库 DS面经

wxw_pku   2020-03-22 13:11

2

用二阶矩、三阶矩、四阶矩是一个思路

我在网上还找到一篇论文,基本思想是用去除离群点的方法来定义长尾的程度,用了分位数和IQR,论文Measuring heavy-tailedness of distributions

SofaSofa数据科学社区DS面试题库 DS面经

strong.man   2020-03-22 17:15

谢谢大佬分享 - 小萌新   2020-04-02 09:12


  相关主题

样本中心矩和样本原点矩的定义分别是什么?   1回答

顺序统计量(order statistics)是什么?   1回答

KL divergence为什么不是对称的?   3回答

怎么理解指数分布里的参数lambda?   1回答

python中计算KL divergence   2回答

QQ-plot图里的x轴y轴是什么意思   1回答

boxplot里的横线是什么意思?   1回答

odds和odds ratio的定义是什么?   1回答

log-normal分布实际有什么用?   3回答

怎么判断一个数据集是双峰分布的?   1回答

长尾分布、肥尾分布、重尾分布?   2回答

Weibull分布是什么分布?现实中有什么例子?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!