如何生成两个相关的标准正态随机变量

  统计/机器学习 概率分布 抽样方法 Python    浏览次数:8651        分享
0

假如有两个标准正态分布$D_1$和$D_2$,并且它们的协方差是0.5。

怎么分别从$D_1$和$D_2$生成随机变量呢?

求思路。如果有python的代码更好,谢谢!

 

Gakki   2018-08-12 08:33



   2个回答 
2

先生成两个标准差为1的独立随机变量的采样$z_1,z_2$,假如要求的协方差为$\rho$,则相关的随机变量的采样$x_1=z_1$,$x_2=\rho z_1+\sqrt{1-\rho^2}z_2$。需要注意此时每个变量的标准差为1,也就是协方差矩阵的对角线都是1,此时两变量间的协方差等于相关系数。

扩展到生成N维相关随机变量$X~ \sim N(\mu,\Sigma)$,先生成N维独立随机变量$Z$,假设$CC^T=\Sigma$,则$X=\mu+CZ$。$C$可以由 Cholesky decomposition生成。

比如$N=2$时,$C=\begin{bmatrix} 1& 0 \\  \rho & \sqrt{1-\rho^2} \end{bmatrix}$

$CC^T=\begin{bmatrix} 1& \rho \\ \rho & 1 \end{bmatrix}$


SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-08-13 09:55

0


import numpy as np
mean = [0, 0]
cov = [[1, 0], [0, 100]] 
x, y = np.random.multivariate_normal(mean, cov, 5000).T


SofaSofa数据科学社区DS面试题库 DS面经

threecifanggen   2018-08-12 17:28



  相关讨论

超几何分布几何分布的关联?

python如何产生指定相关系数的多组数据

两个变量不相关但是也不独立

为什么说皮尔逊相关系数是刻画了线性相关性?

怎么按照设定概率产生不重复的随机排序?

如果x是等级变量, y是连续变量 相关分析是不是用speaman

Python计算两个数组的相关系数

关于两个正态总体抽样分布的独立性问题

特征相关性高的影响

有序分类变量的相关系数

  随便看看

柯西分布没有数学期望

pandas.DataFrame里的loc和iloc什么区别?

为什么样本方差是除以n-1

numpy.full这个函数有什么用?

R里线性回归结果中最后的F-statistic什么意思?有什么用?