关于高斯混合模型的分布的疑问

  统计/机器学习 概率分布 无监督学习    浏览次数: 586
0

高斯混合模型就是很多个高斯分布的叠加

但是明明高斯分布加另一个高斯分布,还是高斯分布

那么高斯混合模型本身就应该是一个大的高斯模型啊

但是高斯混合模型的图画出来明明却又不是高斯分布,这是为什么


 

wlk1993   2018-03-12 23:38



   3个回答 
5

GMM中的叠加,不是加法的

我们说GMM中有多个高斯分布叠加,意思是说GMM中部分数据点服从一个高斯分布,另一部分服从另一个高斯分布。与其说是多个高斯分布的叠加,不如说是多个高斯分布的并集。

看下面的图应该就一目了然了


SofaSofa数据科学社区 DS面经 问答 实战

数据痴汉   2018-03-14 21:47

2

高斯混合模型的意思是说,数据中各个部分分别服从于不同的正态分布。也就是所谓多个高斯分布混合在一起。


SofaSofa数据科学社区 DS面经 问答 实战

姜金杰   2018-03-17 12:29

2

你说的两个独立的随机变量X1,X2服从高斯分布,X=X1+X2也满足高斯分布。注意是随机变量的和。

而GMM里是概率的“和”。p(x)=sum(kiN(x|mu,sigma))。

一小段Matlab:

N=100000;
x1=randn(N,1)*0.2+5;
x2=randn(N,1)*2-2;
x=x1+x2;
ww=[-10 10];
select=rand(N,1); 
idx=select>0.8;
y=zeros(N,1);
y(idx)=x1(idx);
y(~idx)=x2(~idx);
m=1000;
figure;
subplot(411);hist(x1,m),xlim(ww);title('x1')
subplot(412);hist(x2,m),xlim(ww);title('x2')
subplot(413);hist(x,m),xlim(ww);title('x=x1+x2')
subplot(414);hist(y,m),xlim(ww);title('y=GMM')


SofaSofa数据科学社区 DS面经 问答 实战

Zealing   2018-03-18 10:46



  相关主题

用高斯混合模型(GMM)做聚类时,怎么确定component的个数?   2回答

均匀分布的上限的最大似然估计   1回答

二项分布的正态近似   2回答

两个独立的正态随机变量的乘积服从什么分布?   1回答

机器学习中,数据的分布是指什么呢?   1回答

python产生服从常用概率分布的随机数   1回答

生成两组不独立的标准正态分布随机数   1回答

现实生活中有哪些例子是服从帕累托分布的?   1回答

python中实现box-cox变换的函数?   1回答

层次聚类里的linkage是什么意思?   2回答

层次聚类中的Ward's method是什么意思   1回答

什么是K-Modes(K众数)聚类法?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!