Chapter2 随机变量与分布函数

2.1 随机变量

随机变量是以概率空间$\Omega$为定义域，以实数域$R$为值域的函数，可记作：

$$\xi=\xi(\omega),~\omega\in\Omega,~\xi(\omega)\in R$$

个人观点：随机变量就是让每个基本事件对应到一个实数，从而方便概率计算。

Example

某段时间内某寻呼台接到的呼叫数可用$\xi$取非负整数值表示，例如：$\xi=2$表示随机事件{这段时间有两人要求传呼}。

离散型随机变量

取有限个或者可列个值的随机变量称为离散型随机变量。

假定概率空间$(\Omega,A,P)$，离散型随机变量

$$X:\Omega\rightarrow R$$

设$X$的可能取值$x_1,x_2,···,x_N$，取每个值的概率大小

$$P(X=x_i)=p_i$$

则可得分布列：

$$X\sim\begin{pmatrix} x_1&x_2&···&x_N\\
p_1&p_2&···&p_N \end{pmatrix}$$

典例

1.退化分布

$$X\sim\begin{pmatrix} c\\ 1 \end{pmatrix}$$

2.两点分布

$$X\sim\begin{pmatrix} 1&0\\ p&q \end{pmatrix},~p+q=1$$

两点分布适用于描述“正面/反面”“成功/失败”“正常/维修”等随机现象。

3.二项分布（Bernoulli分布）：$X\sim B(n,p)$

$$X\sim\begin{pmatrix} 0&1&···&k&···&n\\ q^n&npq^{n-1}&···&C_n^kp^kq^{n-k}&···&p^n \end{pmatrix},~p+q=1$$

$$P(X=k)=C_n^kp^kq^{n-k}$$

二项分布适用于n重Bernoulli试验。

4.Poisson分布：$X\sim P(\lambda)$（$\lambda>0$）

$$X\sim\begin{pmatrix} 0&1&···&k&···\\ e^{-\lambda}&\lambda e^{-\lambda}&···&\frac{\lambda^k}{k!}e^{-\lambda}&···& \end{pmatrix}$$

$$P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}$$

5.几何分布：$X\sim G(p)$

$$X\sim\begin{pmatrix} 1&2&···&k&···\\ p&pq&···&pq^{k-1}&··· \end{pmatrix},~p+q=1$$

$$P(X=k)=pq^{k-1}$$

考虑随机试验$E$和事件$A$，$P(A)=p$，独立重复$E$，直至$A$发生，记录所做的试验次数，即得到几何分布。

6.超几何分布

$$P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}$$

假设$N$件样品中有$M$件次品，随机抽样$n$件，用$X$表示$n$件产品中的次品数，即得到超几何分布。

连续型随机变量

随机变量取值是一个或几个区间，对于单一取值，$P(X=x)=0$
存在一个密度函数$p(x)$，满足$\int_{-\infty}^{\infty}p(x)dx=1$，$P(X\in B)=\int_Bp(x)dx$

简记为

$$X\sim p(x)$$

典例

1.均匀分布：$X\sim U(a,b)$

$$p(x)=\begin{cases} \frac{1}{b-a},x\in(a,b)\\ 0,else \end{cases}$$

$$P(X\in A)=\frac{|A|}{b-a},~A\subseteq(a,b)$$

向一维空间$(a,b)$随机投点，落点的位置对应为$X$，$X$落在$(a,b)$上任何一个子区间的概率只与区间长度有关，与区间位置无关。

2.指数分布：$X\sim\exp(\lambda)$（$\lambda>0$）

$$p(x)=\begin{cases} \lambda e^{-\lambda x},x\geqslant0\\ 0,else \end{cases}$$

$$P(X>x)=e^{-\lambda x}$$

指数分布通常用于描述人、零件等的寿命，其具有无记忆性（$P(X>x+y|X>y)=P(X>x)$）。

3.正态分布：$X\sim N(\mu,\sigma^2)$

$$p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},~x\in R$$

Proof

证明：$\int_{-\infty}^{\infty}p(x)dx=1$。
换元：令$y=\frac{x-\mu}{\sigma}$
则求证：$\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx=1$
$(\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx)^2=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}\frac{1}{2\pi}e^{-\frac{x^2+y^2}{2}}dxdy$
令$\begin{cases}
x=\rho\cos\theta\\ y=\rho\sin\theta \end{cases}$
则$\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}\frac{1}{2\pi}e^{-\frac{x^2+y^2}{2}}dxdy=\int_0^{\infty}\int_0^{2\pi}\frac{1}{2\pi}e^{-\frac{\rho^2}{2}}\rho d\rho d\theta=1$
因此$\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx=1$，证毕。

正态分布的重要性质：

对称性：关于$x=\mu$对称
渐近线：$y=0$
最大值：$p(x)$在$x=\mu$处取最大值$\frac{1}{\sqrt{2\pi}\sigma}$
$\sigma$增大，曲线变平坦；$\sigma$减小，曲线变陡峭
无法精确计算概率，只有估值$P(X>\mu+\sigma x)=P(X<\mu-\sigma x)\approx\frac{1}{\sqrt{2\pi}x}e^{-\frac{x^2}{2}}$，$x\rightarrow\infty$
$P(|X-\mu|\leqslant3\sigma)\approx0.9997$

一般随机变量

既不是离散型随机变量，也不是离散型随机变量。

Example

$P(X=0)=\frac{1}{2}$
$P(X>x)=\frac{1}{2}e^{-x}$，$x>0$

2.2 分布函数

假定$X$是概率空间$(\Omega,A,P)$上的随机变量，定义$X$的分布函数$F:R\mapsto[0,1]$：

$$F(x)=P(X\leqslant x),~x\in R$$

分布函数的性质：

$F(-\infty)=0$，$F(+\infty)=1$
$F(x)$单调不减
$F(x)$左极限存在，右连续（$P(X<x)=F_{-}(x)$）

给定满足上述三点的实函数$F$，一定能找到一个概率空间$(\Omega,A,P)$和一个随机变量$X$，使得$F(x)=P(X\leqslant x)$。

连续型随机变量的分布函数

$$F(x)=\int_{-\infty}^{x}p(u)du$$

$$F'(x)=p(x)$$

1.均匀分布：$X\sim U(a,b)$

$$F(x)=\begin{cases} 0,x<a\\ \frac{x-a}{b-a},a\leqslant x<b\\ 1,x\geqslant b \end{cases}$$

2.指数分布：$X\sim\exp(\lambda)$

$$F(x)=\begin{cases} 0,x<0\\ 1-e^{-\lambda x},x\geqslant 0 \end{cases}$$

3.正态分布（以标准正态分布为例）

$$F(x)=\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-\frac{u^2}{2}}du$$

$F(x)$没有显性表达式，通常用$\Phi(x)$（Probit函数）表示其分布函数，查表可得。

Note

制表方法不尽相同，仔细甄别。

4.Logistic分布

$$p(x)=\frac{e^{-x}}{(1+e^{-x})^2}$$

$$F(x)=\frac{1}{1+e^{-x}}$$

2.3 随机变量的函数

已知随机变量$X$，则可定义关于$X$的函数

$$Y=f(X),~Y(\omega)=f(X(\omega))$$

当$f$是可测函数时，$Y$是一个随机变量。

Definition

可测： 对于任意波雷尔集$B$，$f(B)$的原像集（$f^{-1}(B)$）也是波雷尔集。
我们目前接触到的$f$大部分都为可测函数。

波雷尔集： 直线上由左开右闭区间经过并、交、逆等运算得到的点集。

离散型随机变量

当$X$是离散型随机变量时，$Y$也是离散型随机变量。

Example

已知$X\sim\begin{pmatrix} -1&0&1&2\\ \frac{1}{8}&\frac{1}{2}&\frac{1}{8}&\frac{1}{4} \end{pmatrix}$，求$Y=X^2$的分布列.

$Y\sim\begin{pmatrix} 1&0&4\\ \frac{1}{8}+\frac{1}{8}&\frac{1}{2}&\frac{1}{4} \end{pmatrix}$

一般的，若

$$X\sim\begin{pmatrix} x_1&x_2&···&x_i&···&x_N\\ p_1&p_2&···&p_i&···&p_N \end{pmatrix},~Y=f(X)$$

则用$f$将$X$的可能取值进行映射：

$${f(x_1),f(x_2),···,f(x_N)}={y_1,y_2,···,y_k}$$

其中$y_1,···,y_k$互不相同。

$$P(Y=y_j)=\sum\limits_{i:f(x_i)=y_j}p_i$$

连续型随机变量

当$X$是连续型随机变量时，$Y$不一定是连续型随机变量。

Example

例1：已知$X\sim N(0,1)$，$f(x)=\begin{cases} -1.x<0\\ 0,x=0\\ 1,x>0 \end{cases}$，求$Y=f(X)$的分布。

$Y\sim\begin{pmatrix} -1&1\\ \frac{1}{2}&\frac{1}{2} \end{pmatrix}$

例2：已知$X\sim N(\mu,\sigma^2)$，求$Y=\frac{X-\mu}{\sigma}$的分布。

$Y$的分布函数
$F(y)=P(Y\leqslant y)$
$=P(\frac{X-\mu}{\sigma}\leqslant y)$
$=P(X\leqslant \mu+\sigma y)$
$=\int_{-\infty}^{\mu+\sigma y}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(u-\mu)^2}{2\sigma^2}}du$
$=\int_{-\infty}^y\frac{1}{\sqrt{2\pi}}e^{-\frac{u^2}{2}}du$
此式恰好为标准正态分布的分布函数
因此$Y\sim N(0,1)$
（非标准正态与标准正态的灵活转换）

例1和例2说明了$Y$可能是离散型随机变量，也可能是连续型随机变量。

定理：

设随机变量$X$的密度函数为$p_X(x)$，$f$严格单调，具有反函数$f^{-1}$，且$f^{-1}$可导，则$Y=f(X)$仍然是连续型随机变量，且具有密度函数：

$$p_Y(y)=p_X(f^{-1}(y))\cdot|(f^{-1})'(y)|$$

Proof

$F_Y(y)=P(Y\leqslant y)$
$=P(f(X)\leqslant y)$
$=P(X\leqslant f^{-1}(y))$（不妨设$f$严格单调递增）
$=F_X(f^{-1}(y))$
两边同时求导：
$p_Y(y)=p_X(f^{-1}(y))\cdot(f^{-1})'(y)$
同理：若$f$严格单调递减：
$F_Y(y)=1-F_X(f^{-1}(y))$
$p_Y(y)=-p_X(f^{-1}(y))\cdot(f^{-1})'(y)$
综上：$p_Y(y)=p_X(f^{-1}(y))\cdot|(f^{-1})'(y)|$

Example

设$X\sim U(0,1)$，$F(x)$是给定的分布函数（满足分布函数的三个条件），求$Y=F^{-1}(X)$的分布。

由于$F(x)$单调不减且右连续，因此定义：
$F^{-1}(y)=\sup{x:F(x)<y}$
$P(Y\leqslant y)=P(F^{-1}(X)\leqslant y)=P(X\leqslant F(y))=F(y)$
因此$Y$的分布函数也是$F(x)$。

上例说明：不论$F(x)$是什么函数，只要满足分布函数的三个条件，就存在随机变量使其分布函数为$F(x)$。

Example

设$X$具有连续的分布函数$F(x)$，求$Y=F(X)$的分布。

$P(Y\leqslant y)=P(F(X)\leqslant y)=P(X\leqslant F^{-1}(y))=F(F^{-1}(y))=y$
因此$Y$的分布函数为1。

2.4 随机向量

给定概率区间$(\Omega,A,P)$

$$X:\Omega\mapsto R^m$$

$$X(\omega)=(X_1(\omega),X_2(\omega),···,X_m(\omega))$$

其中$X_1,X_2,···,X_m$都是随机变量，称$X$为 m维随机向量。

离散型随机向量（以二维为例）

若$X$取值为$x_1,x_2,···$，$Y$取值为$y_1,y_2,···$，则称$(X,Y)$为离散型随机向量。

联合分布

$$p_{ij}=P(X=x_i,Y=y_i),~\sum\limits_{i,j}p_{ij}=1$$

边际分布

$$p_{i.}=P(X=x_i)=\sum\limits_{j=1}^{\infty}p_{ij},~\sum\limits_{i=1}^{\infty}p_{i.}=1$$

$$p_{.j}=P(Y=y_j)=\sum\limits_{i=1}^{\infty}p_{ij},~\sum\limits_{j=1}^{\infty}p_{.j}=1$$

Example

有2个白球，3个黑球，现随机依次抽取两球，每次一个，分别用$X$，$Y$表示第一、二次取得的白球个数，求$(X,Y)$的联合分布和边际分布。

$x_1=0$，$x_2=1$，$y_1=0$，$y_2=1$
$(X,Y)$有四种取值情况。

情况一：有放回
联合分布：
$p_{00}=\frac{3}{5}\times\frac{3}{5}$
$p_{01}=\frac{3}{5}\times\frac{2}{5}$
$p_{10}=\frac{2}{5}\times\frac{3}{5}$
$p_{11}=\frac{2}{5}\times\frac{2}{5}$
边际分布：
$p_{0.}=p_{00}+p_{01}=\frac{3}{5}$
$p_{1.}=p_{10}+p_{11}=\frac{2}{5}$
$p_{.0}=p_{00}+p_{10}=\frac{3}{5}$
$p_{.1}=p_{01}+p_{11}=\frac{2}{5}$

情况二：无放回
联合分布：
$p_{00}=\frac{3}{5}\times\frac{2}{4}$
$p_{01}=\frac{3}{5}\times\frac{2}{4}$
$p_{10}=\frac{2}{5}\times\frac{3}{4}$
$p_{11}=\frac{2}{5}\times\frac{1}{4}$
边际分布：
$p_{0.}=p_{00}+p_{01}=\frac{3}{5}$
$p_{1.}=p_{10}+p_{11}=\frac{2}{5}$
$p_{.0}=p_{00}+p_{10}=\frac{3}{5}$
$p_{.1}=p_{01}+p_{11}=\frac{2}{5}$

从上例我们可以看出，联合分布唯一决定边际分布，边际分布不能唯一决定联合分布。

条件分布

给定$X=x_i$的条件下，$Y$可取值$y_1,y_2,···$

$$P(Y=y_j|X=x_i)=\frac{p_{ij}}{p_{i.}}$$

$$Y|X=x_i\sim\begin{pmatrix} y_1&y_2&···&y_j&···\\ \frac{p_{i1}}{p_{i.}}&\frac{p_{i2}}{p_{i.}}&···&\frac{p_{ij}}{p_{i.}}&··· \end{pmatrix}$$

Note

同理，也有$X|Y=y_j$。但没有$Y=y_j|X$，因为后者的概率之和不为1。

独立性

若离散型随机变量$(X,Y)$中$X$和$Y$相互独立，则对于任意$i,j$，都有

$$P(X=x_i,Y=y_j)=P(X=x_i)P(Y=y_j)$$

即

$$p_{ij}=p_{i.}p_{.j}$$

连续型随机向量（以二维为例）

对于$(X,Y)$，若存在$p(x,y)$，使得

$$p(x,y)\geqslant 0,~\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}p(x,y)dxdy=1$$

且对于任意波雷尔集$A,B\subseteq R$

$$P(X\in A,Y\in B)=\int_A\int_Bp(x,y)dxdy$$

则称$(X,Y)$是连续型随机向量，具有密度函数$p(x,y)$。

联合分布

$$P(X\in A,Y\in B)=\int_A\int_Bp(x,y)dxdy$$

$$P(X\leqslant x,Y\leqslant y)=\int_{-\infty}^x\int_{-\infty}^yp(u,v)dudv$$

边际分布

设$X$的边际密度函数为$p_X(x)$，$Y$的边际密度函数为$p_Y(y)$：

$$p_X(x)=\int_{-\infty}^{\infty}p(x,y)dy$$

$$p_Y(y)=\int_{-\infty}^{\infty}p(x,y)dx$$

同样的，联合分布唯一决定边际分布，边际分布不能唯一决定联合分布。

Example

二元联合正态分布

若随机向量$(X,Y)$的密度函数
$p(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}$
则称$(X,Y)$服从二元联合正态分布，记为$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$
其边际分布：
$p_X(x)=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}$，$X\sim N(\mu_1,\sigma_1^2)$
$p_Y(y)=\frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(y-\mu_2)^2}{2\sigma_2^2}}$，$Y\sim N(\mu_2,\sigma_2^2)$
二元正态分布的边际分布仍是正态分布。

条件分布

$$P(Y\leqslant y|X=x)=\frac{\int_{-\infty}^yp(x,v)dv}{p_X(x)}$$

给定$X=x$，则在此条件下$Y$具有密度函数：

$$p_{Y|X}(y|x)=\frac{p(x,y)}{p_X(x)}$$

独立性

若连续型随机变量$(X,Y)$中$X$和$Y$相互独立，则对于任意$x,y$，都有

$$p(x,y)=p_X(x)p_Y(y)$$

Example

例1：
若$(X,Y)$是矩形区域$(a,b)\times(c,d)$上的均匀分布，则$X$，$Y$相互独立。

例2：
若$(X,Y)$是单位圆$((0,0),1)$上的均匀分布，则$X$，$Y$不相互独立。

例3：
若$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$，则
当$\rho=0$时，$X$，$Y$相互独立；
当$\rho\neq0$时，$X$，$Y$不相互独立。

随机向量分布函数（以二维连续型为例）

联合分布

$$F(x,y)=\int_{-\infty}^x\int_{-\infty}^yp(u,v)dudv$$

$F(x,y)$的基本性质：

$F(-\infty,y)=F(x,-\infty)=0$，$F(+\infty,+\infty)=1$
$F(x,y)$关于$x$和$y$分别单调不减
$F(x,y)$关于$x$和$y$分别存在左极限，右连续
$P(a<X\leqslant b,c< Y\leqslant d)=F(a,c)+F(b,d)-F(a,d)-F(b,c)\geqslant 0$

边际分布

$$F_X(x)=F(x,+\infty)$$

$$F_Y(y)=F(+\infty,y)$$

独立性

若连续型随机变量$(X,Y)$中$X$和$Y$相互独立，则对于任意$x,y$，都有

$$F(x,y)=F_X(x)F_Y(y)$$

若$X$，$Y$相互独立，则对于任意可测函数$f$，$g$，都有$f(X)$，$g(Y)$相互独立。

若$X_1,X_2,···$和$Y_1,Y_2,···$相互独立，则对于任意可测函数$f$，$g$，都有$f(X_1,X_2,···)$，$g(Y_1,Y_2,···)$相互独立。

2.5 随机向量的运算

随机向量的四则运算

离散型加减法

若$(X,Y)$是离散型随机向量，其联合分布为

$$P(X=x_i,Y=y_i)=p_{ij}$$

设随机变量$Z=X+Y$，则其分布为

$$P(Z=z_k)=\sum\limits_{i,j:x_i+y_j=z_k}p_{ij}$$

若$X$，$Y$相互独立，则

$$P(Z=z_k)=\sum\limits_{i,j:x_i+y_j=z_k}p_{i.}p_{.j}$$

Example

例1：Bernoulli随机变量之和
设$X\sim B(n,p)$，$Y\sim B(m,p)$，$X$，$Y$相互独立，求$Z=X+Y$的分布。

$P(Z=k)=P(X+Y=k)$
$=\sum\limits_{l=0}^kP(X=l,Y=k-l)$
$=\sum\limits_{l=0}^kP(X=l)P(Y=k-l)$
$=\sum\limits_{l=0}^kC_n^lp^l(1-p)^{n-l}C_m^{k-l}p^{k-l}(1-p)^{m-(k-l)}$
$=p^k(1-p)^{m+n-k}\sum\limits_{l=0}^kC_n^lC_m^{k-l}$
$=C_{n+m}^kp^k(1-p)^{m+n-k}$
因此，$Z\sim B(m+n,p)$
对于相同的$p$，独立Bernoulli随机变量之和仍是Bernoulli随机变量。

例2：Poisson随机变量之和
设$X\sim P(\lambda)$，$Y\sim P(\mu)$，$X$，$Y$相互独立，求$Z=X+Y$的分布。

$P(Z=k)=P(X+Y=k)$
$=\sum\limits_{l=0}^kP(X=l,Y=k-l)$
$=\sum\limits_{l=0}^kP(X=l)P(Y=k-l)$
$=\sum\limits_{l=0}^k\frac{\lambda^l}{l!}e^{-\lambda}\cdot\frac{\mu^{k-l}}{(k-l)!}e^{-\mu}$
$e^{-(\lambda+\mu)}\frac{1}{k!}\sum\limits_{l=0}^k\frac{k!}{l!(k-l)!}\lambda^l\mu^{k-l}$
$\frac{(\lambda+\mu)^k}{k!}e^{-(\lambda+\mu)}$
因此$Z\sim P(\lambda+\mu)$
独立Poisson随机变量之和仍是Poisson随机变量。

连续型加法

若$(X,Y)$是连续型随机向量，其联合分布密度函数为$p(x,y)$

设随机变量$Z=X+Y$，则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}p(x,z-x)dx$$

若$X$，$Y$相互独立，则

$$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx$$

Example

例1：均匀随机变量之和
设$X\sim U(0,1)$，$Y\sim U(0,1)$，$X$，$Y$相互独立，求$Z=X+Y$的分布。

$Z$的取值为$(0,2)$，因此当$z\leqslant 0$或$z\geqslant 2$时，$p_Z(z)=0$
当$0<z\leqslant 1$时
$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx=\int_0^zdx=z$
当$1<z<2$时
$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx=\int_{z-1}^1dx=2-z$

例2：正态随机变量之和
设$X\sim N(\mu_1,\sigma_1^2)$，$Y\sim N(\mu_2,\sigma_2^2)$，$X$，$Y$相互独立，求$Z=X+Y$的分布。

$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx$
$=\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}dx$
$=\frac{1}{\sqrt{2\pi}\sqrt{\sigma_1^2+\sigma_2^2}}e^{-\frac{[x-(\mu_1+\mu_2)]^2}{2(\sigma_1^2+\sigma_2^2)}}$
因此，$Z\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$
独立正态随机变量之和仍是正态随机变量。

连续型减法

若$(X,Y)$是连续型随机向量，其联合分布密度函数为$p(x,y)$

设随机变量$Z=Y-X$，则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}p(x,z+x)dx$$

若$X$，$Y$相互独立，则

$$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z+x)dx$$

连续型乘法

若$(X,Y)$是连续型随机向量，其联合分布密度函数为$p(x,y)$

设随机变量$Z=XY$，则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}\frac{1}{|x|}p(x,\frac{z}{x})dx$$

若$X$，$Y$相互独立，则

$$p_Z(z)=\int_{-\infty}^{\infty}\frac{1}{|x|}p_X(x)p_Y(\frac{z}{x})dx$$

Note

我们可能会习惯性地将$p(x,\frac{z}{x})$理解为$x$取定某个值时$xy=z$的概率，用点概率积分得到取$z$的点概率，即$p_Z(z)=\int_{-\infty}^{\infty}p(x,\frac{z}{x})dx$，但这是错误的，当我们进行乘法变换$Z=XY$时，变换后的区域会受到$X$值的影响。例如，如果$X$非常小，则$Y$对$Z$的影响会被放大，因此需要引入比例因子来调整变换后的密度，保证最后总积分仍为1。

连续型除法

若$(X,Y)$是连续型随机向量，其联合分布密度函数为$p(x,y)$

设随机变量$Z=\frac{Y}{X}$，则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}|x|p(x,zx)dx$$

若$X$，$Y$相互独立，则

$$p_Z(z)=\int_{-\infty}^{\infty}|x|p_X(x)p_Y(zx)dx$$

Example

设$X\sim N(0,1)$，$Y\sim N(0,1)$，$X$，$Y$相互独立，求$Z=\frac{Y}{X}$的分布。

$p_Z(z)=\int_{-\infty}^{\infty}|x|p_X(x)p_Y(zx)dx$
$=\frac{1}{2\pi}\int_{-\infty}^{\infty}|x|e^{-\frac{x^2(1+z^2)}{2}}dx$
$=\frac{1}{\pi}\int_{0}^{\infty}xe^{-\frac{x^2(1+z^2)}{2}}dx$
$=\frac{1}{\pi}\frac{1}{1+z^2}$
称$Z$为标准Cauchy分布。

随机向量的变换

若$(X,Y)$是连续型随机向量，其联合分布密度函数为$p_{(X,Y)}(x,y)$

若变换如下：

$$\begin{cases} U=f_1(X,Y)\\ V=f_2(X,Y) \end{cases}$$

则随机向量$(U,V)$的分布函数为

$$F_{(U,V)}(u,v)=\int\limits_{(x,y):f_1(x,y)\leqslant u,f_2(x,y)\leqslant v}p(x,y)dxdy$$

若$f_1$，$f_2$存在逆变换，即

$$\begin{cases} X=g_1(U,V)\\ Y=g_2(U,V) \end{cases}$$

则可得到Jaccobi行列式

$$J=\det\begin{pmatrix} \frac{\partial g_1}{\partial u}&\frac{\partial g_1}{\partial v}\\ \frac{\partial g_2}{\partial u}&\frac{\partial g_2}{\partial v} \end{pmatrix}$$

则随机向量$(U,V)$的联合分布密度函数为

$$p_{(U,V)}(u,v)=p_{(X,Y)}(g_1(u,v),g_2(u,v))|J|$$

正态随机向量与其变换

考虑$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$

$$\frac{(x-\mu_1)^2}{\sigma_1^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}=\begin{pmatrix} x-\mu_1&x-\mu_2\\ \end{pmatrix} \begin{pmatrix} \frac{1}{\sigma_1^2}&-\frac{\rho}{\sigma_1\sigma_2}\\ -\frac{\rho}{\sigma_1\sigma_2}&\frac{1}{\sigma_2^2} \end{pmatrix} \begin{pmatrix} x-\mu_1\\ y-\mu_2 \end{pmatrix}$$

记中间的矩阵为$A$。

设

$$\Sigma=\begin{pmatrix} \sigma_1^2&\sigma_1\sigma_2\rho\\ \sigma_1\sigma_2\rho&\sigma_2^2 \end{pmatrix}$$

则

$$\Sigma^{-1}=\frac{1}{1-\rho^2}A$$

$$|\Sigma|=\sigma_1^2\sigma_2^2(1-\rho^2)$$

因此，$(X,Y)$的联合密度函数可写为

$$p_{(X,Y)}(x,y)=\frac{1}{(\sqrt{2\pi})^2|\Sigma|^{\frac{1}{2}}}e^{-\frac{1}{2}\begin{pmatrix} x-\mu_1&y-\mu_2\\ \end{pmatrix}\Sigma^{-1} \begin{pmatrix} x-\mu_1\\ y-\mu_2 \end{pmatrix}}$$

推广到三维：

$$\Sigma=\begin{pmatrix} \sigma_1^2&\sigma_1\sigma_2\rho_{12}&\sigma_1\sigma_3\rho_{13}\\ \sigma_2\sigma_1\rho_{12}&\sigma_2^2&\sigma_2\sigma_3\rho_{23}\\ \sigma_3\sigma_1\rho_{13}&\sigma_3\sigma_2\rho_{23}&\sigma_3^2 \end{pmatrix}$$

$$p_{(X,Y,Z)}(x,y,z)=\frac{1}{(\sqrt{2\pi})^3|\Sigma|^{\frac{1}{2}}}e^{-\frac{1}{2}\begin{pmatrix} x-\mu_1&y-\mu_2&z-\mu_3\\ \end{pmatrix}\Sigma^{-1} \begin{pmatrix} x-\mu_1\\ y-\mu_2\\ z-\mu_3 \end{pmatrix}}$$

推广到n维：

记向量$\mathbf{x}=(x_1,x_2,···,x_n)$，$\mathbf{u}=(\mu_1,\mu_2,···,\mu_n)$，则

$$p(\mathbf{x})=\frac{1}{(\sqrt{2\pi})^n|\Sigma|^{\frac{1}{2}}}e^{-\frac{1}{2}(\mathbf{x}-\mathbf{u})\Sigma^{-1}(\mathbf{x}-\mathbf{u})^T}$$

Example

设$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$，定义：
$\begin{pmatrix} U\\ V \end{pmatrix}= \begin{pmatrix} a&b\\ c&d \end{pmatrix}\cdot \begin{pmatrix} X\\ Y \end{pmatrix}$
求$(U,V)$的分布密度。

记$A=\begin{pmatrix} a&b\\ c&d \end{pmatrix}$
$\begin{pmatrix} X\\ Y \end{pmatrix}=A^{-1}\cdot \begin{pmatrix} U\\ V \end{pmatrix}$
$J=|A^{-1}|=|A|^{-1}$
最后，$(U,V)$的联合密度函数可写作：
$P_{(U,V)}(u,v)=\frac{1}{2\pi|A\Sigma A^T|^{\frac{1}{2}}}e^{-\frac{1}{2}(\mathbf{x}-A\mathbf{u})(A\Sigma A^T)^{-1}(\mathbf{x}-A\mathbf{u})^T}$
$(U,V)\sim N(A\mathbf{u},A^T\Sigma A)$
结论：联合正态随机向量的线性组合仍然是联合正态随机向量。（$X$，$Y$不一定独立）

2.6 极值随机变量

设$X_1,X_2,···,X_n$是概率空间$(\Omega,A,P)$上的随机变量。

对于任意给定的事件$\omega$，对$X_1(\omega),X_2(\omega),···,X_n(\omega)$可以重新排序：

$$X_{(1)}(\omega)\leqslant X_{(2)}(\omega)\leqslant···\leqslant X_{(n)}(\omega)$$

称$X_{(1)},X_{(2)},···,X_{(n)}$为次序随机变量。

其中，$X_{(1)}$为极小随机变量，$X_{(n)}$为极大随机变量，$X_{(k)}$为第$k$小随机变量。

极大值：

若$X_1,X_2,···,X_n$独立同分布，分布函数为$F(x)$，则$X_{(n)}$的分布函数：

$$F_{X_{(n)}}(x)=F^n(x)$$

密度函数：

$$p_{X_{(n)}}(x)=nF(x)^{n-1}F'(x)$$

极小值：

若$X_1,X_2,···,X_n$独立同分布，分布函数为$F(x)$，则$X_{(1)}$的分布函数：

$$F_{X_{(1)}}(x)=1-[1-F(x)]^n$$

密度函数：

$$p_{X_{(1)}}(x)=n[1-F(x)]^{n-1}F'(x)$$

第$k$小值：

若$X_1,X_2,···,X_n$独立同分布，分布函数为$F(x)$，则$X_{(k)}$的密度函数：

$$p_{X_{(k)}}(x)=(n-k+1)C_n^{k-1}F^{k-1}(x)p(x)[1-F(x)]^{n-k}$$

联合分布：

$(X_{(1)},X_{(2)},···,X_{(n)})$的联合概率密度函数：

$$p(X_{(1)}=x_1,X_{(2)}=x_2,···,X_{(n)}=x_n)=n!p(x_1)p(x_2)···p(x_n)$$

Chapter2 随机变量与分布函数

2.1 随机变量

离散型随机变量

典例

连续型随机变量

典例

一般随机变量

2.2 分布函数

连续型随机变量的分布函数

2.3 随机变量的函数

离散型随机变量

连续型随机变量

2.4 随机向量

离散型随机向量（以二维为例）

联合分布

边际分布

条件分布

独立性

连续型随机向量（以二维为例）

联合分布

边际分布

条件分布

独立性

随机向量分布函数（以二维连续型为例）

联合分布

边际分布

独立性

2.5 随机向量的运算

随机向量的四则运算

离散型加减法

连续型加法

连续型减法

连续型乘法

连续型除法

随机向量的变换

正态随机向量与其变换

2.6 极值随机变量

评论