跳转至

Chapter2 随机变量与分布函数


2.1 随机变量

随机变量是以概率空间$\Omega$为定义域,以实数域$R$为值域的函数,可记作:

$$\xi=\xi(\omega),~\omega\in\Omega,~\xi(\omega)\in R$$

个人观点:随机变量就是让每个基本事件对应到一个实数,从而方便概率计算。

Example

某段时间内某寻呼台接到的呼叫数可用$\xi$取非负整数值表示,例如:$\xi=2$表示随机事件{这段时间有两人要求传呼}。

离散型随机变量

取有限个或者可列个值的随机变量称为离散型随机变量

假定概率空间$(\Omega,A,P)$,离散型随机变量

$$X:\Omega\rightarrow R$$

设$X$的可能取值$x_1,x_2,···,x_N$,取每个值的概率大小

$$P(X=x_i)=p_i$$

则可得分布列

$$X\sim\begin{pmatrix} x_1&x_2&···&x_N\\
p_1&p_2&···&p_N \end{pmatrix}$$

典例

1.退化分布

$$X\sim\begin{pmatrix} c\\ 1 \end{pmatrix}$$

2.两点分布

$$X\sim\begin{pmatrix} 1&0\\ p&q \end{pmatrix},~p+q=1$$

两点分布适用于描述“正面/反面”“成功/失败”“正常/维修”等随机现象。

3.二项分布(Bernoulli分布):$X\sim B(n,p)$

$$X\sim\begin{pmatrix} 0&1&···&k&···&n\\ q^n&npq^{n-1}&···&C_n^kp^kq^{n-k}&···&p^n \end{pmatrix},~p+q=1$$

$$P(X=k)=C_n^kp^kq^{n-k}$$

二项分布适用于n重Bernoulli试验。

4.Poisson分布:$X\sim P(\lambda)$($\lambda>0$)

$$X\sim\begin{pmatrix} 0&1&···&k&···\\ e^{-\lambda}&\lambda e^{-\lambda}&···&\frac{\lambda^k}{k!}e^{-\lambda}&···& \end{pmatrix}$$

$$P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}$$

5.几何分布:$X\sim G(p)$

$$X\sim\begin{pmatrix} 1&2&···&k&···\\ p&pq&···&pq^{k-1}&··· \end{pmatrix},~p+q=1$$

$$P(X=k)=pq^{k-1}$$

考虑随机试验$E$和事件$A$,$P(A)=p$,独立重复$E$,直至$A$发生,记录所做的试验次数,即得到几何分布。

6.超几何分布

$$P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}$$

假设$N$件样品中有$M$件次品,随机抽样$n$件,用$X$表示$n$件产品中的次品数,即得到超几何分布。

连续型随机变量

  • 随机变量取值是一个或几个区间,对于单一取值,$P(X=x)=0$
  • 存在一个密度函数$p(x)$,满足$\int_{-\infty}^{\infty}p(x)dx=1$,$P(X\in B)=\int_Bp(x)dx$

简记为

$$X\sim p(x)$$

典例

1.均匀分布:$X\sim U(a,b)$

$$p(x)=\begin{cases} \frac{1}{b-a},x\in(a,b)\\ 0,else \end{cases}$$

$$P(X\in A)=\frac{|A|}{b-a},~A\subseteq(a,b)$$

向一维空间$(a,b)$随机投点,落点的位置对应为$X$,$X$落在$(a,b)$上任何一个子区间的概率只与区间长度有关,与区间位置无关。

2.指数分布:$X\sim\exp(\lambda)$($\lambda>0$)

$$p(x)=\begin{cases} \lambda e^{-\lambda x},x\geqslant0\\ 0,else \end{cases}$$

$$P(X>x)=e^{-\lambda x}$$

指数分布通常用于描述人、零件等的寿命,其具有无记忆性($P(X>x+y|X>y)=P(X>x)$)。

3.正态分布:$X\sim N(\mu,\sigma^2)$

$$p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},~x\in R$$

Proof

证明:$\int_{-\infty}^{\infty}p(x)dx=1$。
换元:令$y=\frac{x-\mu}{\sigma}$
则求证:$\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx=1$
$(\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx)^2=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}\frac{1}{2\pi}e^{-\frac{x^2+y^2}{2}}dxdy$
令$\begin{cases}
x=\rho\cos\theta\\ y=\rho\sin\theta \end{cases}$
则$\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}\frac{1}{2\pi}e^{-\frac{x^2+y^2}{2}}dxdy=\int_0^{\infty}\int_0^{2\pi}\frac{1}{2\pi}e^{-\frac{\rho^2}{2}}\rho d\rho d\theta=1$
因此$\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx=1$,证毕。

正态分布的重要性质:

  • 对称性:关于$x=\mu$对称
  • 渐近线:$y=0$
  • 最大值:$p(x)$在$x=\mu$处取最大值$\frac{1}{\sqrt{2\pi}\sigma}$
  • $\sigma$增大,曲线变平坦;$\sigma$减小,曲线变陡峭
  • 无法精确计算概率,只有估值$P(X>\mu+\sigma x)=P(X<\mu-\sigma x)\approx\frac{1}{\sqrt{2\pi}x}e^{-\frac{x^2}{2}}$,$x\rightarrow\infty$
  • $P(|X-\mu|\leqslant3\sigma)\approx0.9997$

一般随机变量

既不是离散型随机变量,也不是离散型随机变量。

Example

$P(X=0)=\frac{1}{2}$
$P(X>x)=\frac{1}{2}e^{-x}$,$x>0$


2.2 分布函数

假定$X$是概率空间$(\Omega,A,P)$上的随机变量,定义$X$的分布函数$F:R\mapsto[0,1]$:

$$F(x)=P(X\leqslant x),~x\in R$$

分布函数的性质:

  • $F(-\infty)=0$,$F(+\infty)=1$
  • $F(x)$单调不减
  • $F(x)$左极限存在,右连续($P(X<x)=F_{-}(x)$)

给定满足上述三点的实函数$F$,一定能找到一个概率空间$(\Omega,A,P)$和一个随机变量$X$,使得$F(x)=P(X\leqslant x)$。

连续型随机变量的分布函数

$$F(x)=\int_{-\infty}^{x}p(u)du$$

$$F'(x)=p(x)$$

1.均匀分布:$X\sim U(a,b)$

$$F(x)=\begin{cases} 0,x<a\\ \frac{x-a}{b-a},a\leqslant x<b\\ 1,x\geqslant b \end{cases}$$

2.指数分布:$X\sim\exp(\lambda)$

$$F(x)=\begin{cases} 0,x<0\\ 1-e^{-\lambda x},x\geqslant 0 \end{cases}$$

3.正态分布(以标准正态分布为例)

$$F(x)=\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-\frac{u^2}{2}}du$$

$F(x)$没有显性表达式,通常用$\Phi(x)$(Probit函数)表示其分布函数,查表可得。

Note

制表方法不尽相同,仔细甄别。

4.Logistic分布

$$p(x)=\frac{e^{-x}}{(1+e^{-x})^2}$$

$$F(x)=\frac{1}{1+e^{-x}}$$


2.3 随机变量的函数

已知随机变量$X$,则可定义关于$X$的函数

$$Y=f(X),~Y(\omega)=f(X(\omega))$$

当$f$是可测函数时,$Y$是一个随机变量。

Definition

可测: 对于任意波雷尔集$B$,$f(B)$的原像集($f^{-1}(B)$)也是波雷尔集。
我们目前接触到的$f$大部分都为可测函数。

波雷尔集: 直线上由左开右闭区间经过并、交、逆等运算得到的点集。

离散型随机变量

当$X$是离散型随机变量时,$Y$也是离散型随机变量。

Example

已知$X\sim\begin{pmatrix} -1&0&1&2\\ \frac{1}{8}&\frac{1}{2}&\frac{1}{8}&\frac{1}{4} \end{pmatrix}$,求$Y=X^2$的分布列.

$Y\sim\begin{pmatrix} 1&0&4\\ \frac{1}{8}+\frac{1}{8}&\frac{1}{2}&\frac{1}{4} \end{pmatrix}$

一般的,若

$$X\sim\begin{pmatrix} x_1&x_2&···&x_i&···&x_N\\ p_1&p_2&···&p_i&···&p_N \end{pmatrix},~Y=f(X)$$

则用$f$将$X$的可能取值进行映射:

$${f(x_1),f(x_2),···,f(x_N)}={y_1,y_2,···,y_k}$$

其中$y_1,···,y_k$互不相同。

$$P(Y=y_j)=\sum\limits_{i:f(x_i)=y_j}p_i$$

连续型随机变量

当$X$是连续型随机变量时,$Y$不一定是连续型随机变量。

Example

例1:已知$X\sim N(0,1)$,$f(x)=\begin{cases} -1.x<0\\ 0,x=0\\ 1,x>0 \end{cases}$,求$Y=f(X)$的分布。

$Y\sim\begin{pmatrix} -1&1\\ \frac{1}{2}&\frac{1}{2} \end{pmatrix}$

例2:已知$X\sim N(\mu,\sigma^2)$,求$Y=\frac{X-\mu}{\sigma}$的分布。

$Y$的分布函数
$F(y)=P(Y\leqslant y)$
$=P(\frac{X-\mu}{\sigma}\leqslant y)$
$=P(X\leqslant \mu+\sigma y)$
$=\int_{-\infty}^{\mu+\sigma y}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(u-\mu)^2}{2\sigma^2}}du$
$=\int_{-\infty}^y\frac{1}{\sqrt{2\pi}}e^{-\frac{u^2}{2}}du$
此式恰好为标准正态分布的分布函数
因此$Y\sim N(0,1)$
(非标准正态与标准正态的灵活转换)

例1和例2说明了$Y$可能是离散型随机变量,也可能是连续型随机变量。

定理:

设随机变量$X$的密度函数为$p_X(x)$,$f$严格单调,具有反函数$f^{-1}$,且$f^{-1}$可导,则$Y=f(X)$仍然是连续型随机变量,且具有密度函数:

$$p_Y(y)=p_X(f^{-1}(y))\cdot|(f^{-1})'(y)|$$

Proof

$F_Y(y)=P(Y\leqslant y)$
$=P(f(X)\leqslant y)$
$=P(X\leqslant f^{-1}(y))$(不妨设$f$严格单调递增)
$=F_X(f^{-1}(y))$
两边同时求导:
$p_Y(y)=p_X(f^{-1}(y))\cdot(f^{-1})'(y)$
同理:若$f$严格单调递减:
$F_Y(y)=1-F_X(f^{-1}(y))$
$p_Y(y)=-p_X(f^{-1}(y))\cdot(f^{-1})'(y)$
综上:$p_Y(y)=p_X(f^{-1}(y))\cdot|(f^{-1})'(y)|$

Example

设$X\sim U(0,1)$,$F(x)$是给定的分布函数(满足分布函数的三个条件),求$Y=F^{-1}(X)$的分布。

由于$F(x)$单调不减且右连续,因此定义:
$F^{-1}(y)=\sup{x:F(x)<y}$
$P(Y\leqslant y)=P(F^{-1}(X)\leqslant y)=P(X\leqslant F(y))=F(y)$
因此$Y$的分布函数也是$F(x)$。

上例说明:不论$F(x)$是什么函数,只要满足分布函数的三个条件,就存在随机变量使其分布函数为$F(x)$。

Example

设$X$具有连续的分布函数$F(x)$,求$Y=F(X)$的分布。

$P(Y\leqslant y)=P(F(X)\leqslant y)=P(X\leqslant F^{-1}(y))=F(F^{-1}(y))=y$
因此$Y$的分布函数为1。


2.4 随机向量

给定概率区间$(\Omega,A,P)$

$$X:\Omega\mapsto R^m$$

$$X(\omega)=(X_1(\omega),X_2(\omega),···,X_m(\omega))$$

其中$X_1,X_2,···,X_m$都是随机变量,称$X$为 m维随机向量

离散型随机向量(以二维为例)

若$X$取值为$x_1,x_2,···$,$Y$取值为$y_1,y_2,···$,则称$(X,Y)$为离散型随机向量

联合分布

$$p_{ij}=P(X=x_i,Y=y_i),~\sum\limits_{i,j}p_{ij}=1$$

边际分布

$$p_{i.}=P(X=x_i)=\sum\limits_{j=1}^{\infty}p_{ij},~\sum\limits_{i=1}^{\infty}p_{i.}=1$$

$$p_{.j}=P(Y=y_j)=\sum\limits_{i=1}^{\infty}p_{ij},~\sum\limits_{j=1}^{\infty}p_{.j}=1$$

Example

有2个白球,3个黑球,现随机依次抽取两球,每次一个,分别用$X$,$Y$表示第一、二次取得的白球个数,求$(X,Y)$的联合分布和边际分布。

$x_1=0$,$x_2=1$,$y_1=0$,$y_2=1$
$(X,Y)$有四种取值情况。

情况一:有放回
联合分布:
$p_{00}=\frac{3}{5}\times\frac{3}{5}$
$p_{01}=\frac{3}{5}\times\frac{2}{5}$
$p_{10}=\frac{2}{5}\times\frac{3}{5}$
$p_{11}=\frac{2}{5}\times\frac{2}{5}$
边际分布:
$p_{0.}=p_{00}+p_{01}=\frac{3}{5}$
$p_{1.}=p_{10}+p_{11}=\frac{2}{5}$
$p_{.0}=p_{00}+p_{10}=\frac{3}{5}$
$p_{.1}=p_{01}+p_{11}=\frac{2}{5}$

情况二:无放回
联合分布:
$p_{00}=\frac{3}{5}\times\frac{2}{4}$
$p_{01}=\frac{3}{5}\times\frac{2}{4}$
$p_{10}=\frac{2}{5}\times\frac{3}{4}$
$p_{11}=\frac{2}{5}\times\frac{1}{4}$
边际分布:
$p_{0.}=p_{00}+p_{01}=\frac{3}{5}$
$p_{1.}=p_{10}+p_{11}=\frac{2}{5}$
$p_{.0}=p_{00}+p_{10}=\frac{3}{5}$
$p_{.1}=p_{01}+p_{11}=\frac{2}{5}$

从上例我们可以看出,联合分布唯一决定边际分布,边际分布不能唯一决定联合分布

条件分布

给定$X=x_i$的条件下,$Y$可取值$y_1,y_2,···$

$$P(Y=y_j|X=x_i)=\frac{p_{ij}}{p_{i.}}$$

$$Y|X=x_i\sim\begin{pmatrix} y_1&y_2&···&y_j&···\\ \frac{p_{i1}}{p_{i.}}&\frac{p_{i2}}{p_{i.}}&···&\frac{p_{ij}}{p_{i.}}&··· \end{pmatrix}$$

Note

同理,也有$X|Y=y_j$。但没有$Y=y_j|X$,因为后者的概率之和不为1。

独立性

若离散型随机变量$(X,Y)$中$X$和$Y$相互独立,则对于任意$i,j$,都有

$$P(X=x_i,Y=y_j)=P(X=x_i)P(Y=y_j)$$

$$p_{ij}=p_{i.}p_{.j}$$

连续型随机向量(以二维为例)

对于$(X,Y)$,若存在$p(x,y)$,使得

$$p(x,y)\geqslant 0,~\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}p(x,y)dxdy=1$$

且对于任意波雷尔集$A,B\subseteq R$

$$P(X\in A,Y\in B)=\int_A\int_Bp(x,y)dxdy$$

则称$(X,Y)$是连续型随机向量,具有密度函数$p(x,y)$。

联合分布

$$P(X\in A,Y\in B)=\int_A\int_Bp(x,y)dxdy$$

$$P(X\leqslant x,Y\leqslant y)=\int_{-\infty}^x\int_{-\infty}^yp(u,v)dudv$$

边际分布

设$X$的边际密度函数为$p_X(x)$,$Y$的边际密度函数为$p_Y(y)$:

$$p_X(x)=\int_{-\infty}^{\infty}p(x,y)dy$$

$$p_Y(y)=\int_{-\infty}^{\infty}p(x,y)dx$$

同样的,联合分布唯一决定边际分布,边际分布不能唯一决定联合分布

Example

二元联合正态分布

若随机向量$(X,Y)$的密度函数
$p(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}$
则称$(X,Y)$服从二元联合正态分布,记为$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$
其边际分布:
$p_X(x)=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}$,$X\sim N(\mu_1,\sigma_1^2)$
$p_Y(y)=\frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(y-\mu_2)^2}{2\sigma_2^2}}$,$Y\sim N(\mu_2,\sigma_2^2)$
二元正态分布的边际分布仍是正态分布。

条件分布

$$P(Y\leqslant y|X=x)=\frac{\int_{-\infty}^yp(x,v)dv}{p_X(x)}$$

给定$X=x$,则在此条件下$Y$具有密度函数:

$$p_{Y|X}(y|x)=\frac{p(x,y)}{p_X(x)}$$

独立性

若连续型随机变量$(X,Y)$中$X$和$Y$相互独立,则对于任意$x,y$,都有

$$p(x,y)=p_X(x)p_Y(y)$$

Example

例1:
若$(X,Y)$是矩形区域$(a,b)\times(c,d)$上的均匀分布,则$X$,$Y$相互独立。

例2:
若$(X,Y)$是单位圆$((0,0),1)$上的均匀分布,则$X$,$Y$不相互独立。

例3:
若$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$,则
当$\rho=0$时,$X$,$Y$相互独立;
当$\rho\neq0$时,$X$,$Y$不相互独立。

随机向量分布函数(以二维连续型为例)

联合分布

$$F(x,y)=\int_{-\infty}^x\int_{-\infty}^yp(u,v)dudv$$

$F(x,y)$的基本性质:

  • $F(-\infty,y)=F(x,-\infty)=0$,$F(+\infty,+\infty)=1$
  • $F(x,y)$关于$x$和$y$分别单调不减
  • $F(x,y)$关于$x$和$y$分别存在左极限,右连续
  • $P(a<X\leqslant b,c< Y\leqslant d)=F(a,c)+F(b,d)-F(a,d)-F(b,c)\geqslant 0$

边际分布

$$F_X(x)=F(x,+\infty)$$

$$F_Y(y)=F(+\infty,y)$$

独立性

若连续型随机变量$(X,Y)$中$X$和$Y$相互独立,则对于任意$x,y$,都有

$$F(x,y)=F_X(x)F_Y(y)$$

若$X$,$Y$相互独立,则对于任意可测函数$f$,$g$,都有$f(X)$,$g(Y)$相互独立。

若$X_1,X_2,···$和$Y_1,Y_2,···$相互独立,则对于任意可测函数$f$,$g$,都有$f(X_1,X_2,···)$,$g(Y_1,Y_2,···)$相互独立。


2.5 随机向量的运算

随机向量的四则运算

离散型加减法

若$(X,Y)$是离散型随机向量,其联合分布为

$$P(X=x_i,Y=y_i)=p_{ij}$$

设随机变量$Z=X+Y$,则其分布为

$$P(Z=z_k)=\sum\limits_{i,j:x_i+y_j=z_k}p_{ij}$$

若$X$,$Y$相互独立,则

$$P(Z=z_k)=\sum\limits_{i,j:x_i+y_j=z_k}p_{i.}p_{.j}$$

Example

例1:Bernoulli随机变量之和
设$X\sim B(n,p)$,$Y\sim B(m,p)$,$X$,$Y$相互独立,求$Z=X+Y$的分布。

$P(Z=k)=P(X+Y=k)$
$=\sum\limits_{l=0}^kP(X=l,Y=k-l)$
$=\sum\limits_{l=0}^kP(X=l)P(Y=k-l)$
$=\sum\limits_{l=0}^kC_n^lp^l(1-p)^{n-l}C_m^{k-l}p^{k-l}(1-p)^{m-(k-l)}$
$=p^k(1-p)^{m+n-k}\sum\limits_{l=0}^kC_n^lC_m^{k-l}$
$=C_{n+m}^kp^k(1-p)^{m+n-k}$
因此,$Z\sim B(m+n,p)$
对于相同的$p$,独立Bernoulli随机变量之和仍是Bernoulli随机变量。

例2:Poisson随机变量之和
设$X\sim P(\lambda)$,$Y\sim P(\mu)$,$X$,$Y$相互独立,求$Z=X+Y$的分布。

$P(Z=k)=P(X+Y=k)$
$=\sum\limits_{l=0}^kP(X=l,Y=k-l)$
$=\sum\limits_{l=0}^kP(X=l)P(Y=k-l)$
$=\sum\limits_{l=0}^k\frac{\lambda^l}{l!}e^{-\lambda}\cdot\frac{\mu^{k-l}}{(k-l)!}e^{-\mu}$
$e^{-(\lambda+\mu)}\frac{1}{k!}\sum\limits_{l=0}^k\frac{k!}{l!(k-l)!}\lambda^l\mu^{k-l}$
$\frac{(\lambda+\mu)^k}{k!}e^{-(\lambda+\mu)}$
因此$Z\sim P(\lambda+\mu)$
独立Poisson随机变量之和仍是Poisson随机变量。

连续型加法

若$(X,Y)$是连续型随机向量,其联合分布密度函数为$p(x,y)$

设随机变量$Z=X+Y$,则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}p(x,z-x)dx$$

若$X$,$Y$相互独立,则

$$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx$$

Example

例1:均匀随机变量之和
设$X\sim U(0,1)$,$Y\sim U(0,1)$,$X$,$Y$相互独立,求$Z=X+Y$的分布。

$Z$的取值为$(0,2)$,因此当$z\leqslant 0$或$z\geqslant 2$时,$p_Z(z)=0$
当$0<z\leqslant 1$时
$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx=\int_0^zdx=z$
当$1<z<2$时
$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx=\int_{z-1}^1dx=2-z$

例2:正态随机变量之和
设$X\sim N(\mu_1,\sigma_1^2)$,$Y\sim N(\mu_2,\sigma_2^2)$,$X$,$Y$相互独立,求$Z=X+Y$的分布。

$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z-x)dx$
$=\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(z-x-\mu_2)^2}{2\sigma_2^2}}dx$
$=\frac{1}{\sqrt{2\pi}\sqrt{\sigma_1^2+\sigma_2^2}}e^{-\frac{[x-(\mu_1+\mu_2)]^2}{2(\sigma_1^2+\sigma_2^2)}}$
因此,$Z\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)$
独立正态随机变量之和仍是正态随机变量。

连续型减法

若$(X,Y)$是连续型随机向量,其联合分布密度函数为$p(x,y)$

设随机变量$Z=Y-X$,则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}p(x,z+x)dx$$

若$X$,$Y$相互独立,则

$$p_Z(z)=\int_{-\infty}^{\infty}p_X(x)p_Y(z+x)dx$$

连续型乘法

若$(X,Y)$是连续型随机向量,其联合分布密度函数为$p(x,y)$

设随机变量$Z=XY$,则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}\frac{1}{|x|}p(x,\frac{z}{x})dx$$

若$X$,$Y$相互独立,则

$$p_Z(z)=\int_{-\infty}^{\infty}\frac{1}{|x|}p_X(x)p_Y(\frac{z}{x})dx$$

Note

我们可能会习惯性地将$p(x,\frac{z}{x})$理解为$x$取定某个值时$xy=z$的概率,用点概率积分得到取$z$的点概率,即$p_Z(z)=\int_{-\infty}^{\infty}p(x,\frac{z}{x})dx$,但这是错误的,当我们进行乘法变换$Z=XY$时,变换后的区域会受到$X$值的影响。例如,如果$X$非常小,则$Y$对$Z$的影响会被放大,因此需要引入比例因子来调整变换后的密度,保证最后总积分仍为1。

连续型除法

若$(X,Y)$是连续型随机向量,其联合分布密度函数为$p(x,y)$

设随机变量$Z=\frac{Y}{X}$,则其密度函数为

$$p_Z(z)=\int_{-\infty}^{\infty}|x|p(x,zx)dx$$

若$X$,$Y$相互独立,则

$$p_Z(z)=\int_{-\infty}^{\infty}|x|p_X(x)p_Y(zx)dx$$

Example

设$X\sim N(0,1)$,$Y\sim N(0,1)$,$X$,$Y$相互独立,求$Z=\frac{Y}{X}$的分布。

$p_Z(z)=\int_{-\infty}^{\infty}|x|p_X(x)p_Y(zx)dx$
$=\frac{1}{2\pi}\int_{-\infty}^{\infty}|x|e^{-\frac{x^2(1+z^2)}{2}}dx$
$=\frac{1}{\pi}\int_{0}^{\infty}xe^{-\frac{x^2(1+z^2)}{2}}dx$
$=\frac{1}{\pi}\frac{1}{1+z^2}$
称$Z$为标准Cauchy分布

随机向量的变换

若$(X,Y)$是连续型随机向量,其联合分布密度函数为$p_{(X,Y)}(x,y)$

若变换如下:

$$\begin{cases} U=f_1(X,Y)\\ V=f_2(X,Y) \end{cases}$$

则随机向量$(U,V)$的分布函数为

$$F_{(U,V)}(u,v)=\int\limits_{(x,y):f_1(x,y)\leqslant u,f_2(x,y)\leqslant v}p(x,y)dxdy$$

若$f_1$,$f_2$存在逆变换,即

$$\begin{cases} X=g_1(U,V)\\ Y=g_2(U,V) \end{cases}$$

则可得到Jaccobi行列式

$$J=\det\begin{pmatrix} \frac{\partial g_1}{\partial u}&\frac{\partial g_1}{\partial v}\\ \frac{\partial g_2}{\partial u}&\frac{\partial g_2}{\partial v} \end{pmatrix}$$

则随机向量$(U,V)$的联合分布密度函数为

$$p_{(U,V)}(u,v)=p_{(X,Y)}(g_1(u,v),g_2(u,v))|J|$$

正态随机向量与其变换

考虑$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$

$$\frac{(x-\mu_1)^2}{\sigma_1^2}-\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}=\begin{pmatrix} x-\mu_1&x-\mu_2\\ \end{pmatrix} \begin{pmatrix} \frac{1}{\sigma_1^2}&-\frac{\rho}{\sigma_1\sigma_2}\\ -\frac{\rho}{\sigma_1\sigma_2}&\frac{1}{\sigma_2^2} \end{pmatrix} \begin{pmatrix} x-\mu_1\\ y-\mu_2 \end{pmatrix}$$

记中间的矩阵为$A$。

$$\Sigma=\begin{pmatrix} \sigma_1^2&\sigma_1\sigma_2\rho\\ \sigma_1\sigma_2\rho&\sigma_2^2 \end{pmatrix}$$

$$\Sigma^{-1}=\frac{1}{1-\rho^2}A$$

$$|\Sigma|=\sigma_1^2\sigma_2^2(1-\rho^2)$$

因此,$(X,Y)$的联合密度函数可写为

$$p_{(X,Y)}(x,y)=\frac{1}{(\sqrt{2\pi})^2|\Sigma|^{\frac{1}{2}}}e^{-\frac{1}{2}\begin{pmatrix} x-\mu_1&y-\mu_2\\ \end{pmatrix}\Sigma^{-1} \begin{pmatrix} x-\mu_1\\ y-\mu_2 \end{pmatrix}}$$

推广到三维:

$$\Sigma=\begin{pmatrix} \sigma_1^2&\sigma_1\sigma_2\rho_{12}&\sigma_1\sigma_3\rho_{13}\\ \sigma_2\sigma_1\rho_{12}&\sigma_2^2&\sigma_2\sigma_3\rho_{23}\\ \sigma_3\sigma_1\rho_{13}&\sigma_3\sigma_2\rho_{23}&\sigma_3^2 \end{pmatrix}$$

$$p_{(X,Y,Z)}(x,y,z)=\frac{1}{(\sqrt{2\pi})^3|\Sigma|^{\frac{1}{2}}}e^{-\frac{1}{2}\begin{pmatrix} x-\mu_1&y-\mu_2&z-\mu_3\\ \end{pmatrix}\Sigma^{-1} \begin{pmatrix} x-\mu_1\\ y-\mu_2\\ z-\mu_3 \end{pmatrix}}$$

推广到n维:

记向量$\mathbf{x}=(x_1,x_2,···,x_n)$,$\mathbf{u}=(\mu_1,\mu_2,···,\mu_n)$,则

$$p(\mathbf{x})=\frac{1}{(\sqrt{2\pi})^n|\Sigma|^{\frac{1}{2}}}e^{-\frac{1}{2}(\mathbf{x}-\mathbf{u})\Sigma^{-1}(\mathbf{x}-\mathbf{u})^T}$$

Example

设$(X,Y)\sim N(\mu_1,\sigma_1^2,\mu_2,\sigma_2^2,\rho)$,定义:
$\begin{pmatrix} U\\ V \end{pmatrix}= \begin{pmatrix} a&b\\ c&d \end{pmatrix}\cdot \begin{pmatrix} X\\ Y \end{pmatrix}$
求$(U,V)$的分布密度。

记$A=\begin{pmatrix} a&b\\ c&d \end{pmatrix}$
$\begin{pmatrix} X\\ Y \end{pmatrix}=A^{-1}\cdot \begin{pmatrix} U\\ V \end{pmatrix}$
$J=|A^{-1}|=|A|^{-1}$
最后,$(U,V)$的联合密度函数可写作:
$P_{(U,V)}(u,v)=\frac{1}{2\pi|A\Sigma A^T|^{\frac{1}{2}}}e^{-\frac{1}{2}(\mathbf{x}-A\mathbf{u})(A\Sigma A^T)^{-1}(\mathbf{x}-A\mathbf{u})^T}$
$(U,V)\sim N(A\mathbf{u},A^T\Sigma A)$
结论:联合正态随机向量的线性组合仍然是联合正态随机向量。($X$,$Y$不一定独立)


2.6 极值随机变量

设$X_1,X_2,···,X_n$是概率空间$(\Omega,A,P)$上的随机变量。

对于任意给定的事件$\omega$,对$X_1(\omega),X_2(\omega),···,X_n(\omega)$可以重新排序:

$$X_{(1)}(\omega)\leqslant X_{(2)}(\omega)\leqslant···\leqslant X_{(n)}(\omega)$$

称$X_{(1)},X_{(2)},···,X_{(n)}$为次序随机变量

其中,$X_{(1)}$为极小随机变量,$X_{(n)}$为极大随机变量,$X_{(k)}$为第$k$小随机变量。

极大值:

若$X_1,X_2,···,X_n$独立同分布,分布函数为$F(x)$,则$X_{(n)}$的分布函数:

$$F_{X_{(n)}}(x)=F^n(x)$$

密度函数:

$$p_{X_{(n)}}(x)=nF(x)^{n-1}F'(x)$$

极小值:

若$X_1,X_2,···,X_n$独立同分布,分布函数为$F(x)$,则$X_{(1)}$的分布函数:

$$F_{X_{(1)}}(x)=1-[1-F(x)]^n$$

密度函数:

$$p_{X_{(1)}}(x)=n[1-F(x)]^{n-1}F'(x)$$

第$k$小值:

若$X_1,X_2,···,X_n$独立同分布,分布函数为$F(x)$,则$X_{(k)}$的密度函数:

$$p_{X_{(k)}}(x)=(n-k+1)C_n^{k-1}F^{k-1}(x)p(x)[1-F(x)]^{n-k}$$

联合分布:

$(X_{(1)},X_{(2)},···,X_{(n)})$的联合概率密度函数:

$$p(X_{(1)}=x_1,X_{(2)}=x_2,···,X_{(n)}=x_n)=n!p(x_1)p(x_2)···p(x_n)$$

评论