第3章 多维随机变量及其分布

3.1 复习笔记

一、多维随机变量及其联合分布

1多维随机变量

定义:如果X1(ω),X2(ω),…,Xn(ω)是定义在同一个样本空间Ω={ω}上的n个随机变量,则称X(ω)=(X1(ω),X2(ω),…,Xn(ω))为n维(或n元)随机变量或随机向量.

2联合分布函数

(1)定义

对任意的n个实数x1,x2,…,xn,则n个事件{X1≤x1},{X2≤x2},…,{Xn≤xn}同时发生的概率F(x1,x2,…,xn)=P(X1≤x1,X2≤x2,…,Xn≤xn)称为n维随机变量(X1,X2,…,Xn)的联合分布函数.

(2)联合分布函数F(x,y)的基本性质

单调性:F(x,y)分别对x或y是单调非减的,即当x1<x2时,有F(x1,y)≤F(x2,y),当y1<y2时,有F(x,y1)≤F(x,y2).

有界性:对任意的x或y,有0≤F(x,y)≤1,且

右连续性:对每个变量都是右连续的,即F(x+0,y)=F(x,y),F(x,y+0)=F(x,y).

非负性:对任意的a<b,c<d有

P(a<X≤b,c<Y≤d)=F(b,d)-F(a,d)-F(b,c)+F(a,c)≥0

3联合分布列

(1)定义:如果二维随机变量(X,Y)只取有限个或可列个数对(xi,yj),则称(X,Y)为二维离散随机变量,称Pij=P(X=xi,Y=yj),i,j=1,2,…为(X,Y)的联合分布列,也可如下用表格形式记联合分布列

(2)联合分布列的基本性质:

非负性:Pij≥0;

正则性:Pij≥0,

求二维离散随机变量的联合分布列,关键是写出二维随机变量可能取的数对及其发生的概率.

4联合密度函数

(1)定义:如果存在二元非负函数P(x,y),使得二维随机变量(x,y)的分布函数F(x,y)可表示为

则称(X,Y)为二维连续随机变量,称P(u,v)为(X,Y)的联合密度函数.

若F(x,y)偏导数存在,则有联合密度函数

(2)联合密度函数的基本性质:

非负性:p(x,y)≥0;

正则性:

若G为平面上的一个区域,则事件{(X,Y)∈G}的概率可表示为在G上对p(x,y)的二重积分.

注:在使用上式时,关键是找出p(x,y)的非零区域与G的交集部分,确定积分区域,然后设法化成累次积分,最后计算出结果,计算中要注意如下事实,“直线的面积为零”,故积分区域的边界线是否在积分区域内不影响概率计算结果.

5常用多维分布

(1)多项分布

进行n次独立重复试验,如果每次试验有r个互不相容结果:A1,A2,…Ar,之一发生,且每次试验中Ai发生的概率为pi=P(Ai),i=1,2,…,r,且p1+p2+…+pr=1.记Xi为n次独立重复试验中Ai出现的次数,i=1,2,…,r.则(X1,X2,…,Xr)取值(n1,n2,…,nr)的概率,即A1出现n1次,A2出现n2次,……,Ar出现nr次的概率为

这个联合分布列称为r项分布,又称多项分布,记为M(n,p1,p2,…,pr).这个概率是多项式(p1+p2+prn展开式中的一项,故其和为1.多项分布是二项分布的推广,当r=2时,即为二项分布.

(2)多维超几何分布

若袋中有N个球,其中有Ni个i号球,i=1,2,…,r,且N=N1+N2+…+Nr,从中任意取出n个,若记Xi为取出的n个球中i号球的个数,i=1,2,…,r,则

其中n1+n2+…+nr=n

(3)多维均匀分布

设D为Rn中的一个有界区域,其度量(平面的为面积,空间的为体积等)为SD,如果多维随机变量(X1,X2,…,Xn)的联合密度函数为

则称(X1,X2,…,Xn

服从D上的多维均匀分布,记为(X1,X2,…,Xn)~U(D).

二维均匀分布所描述的随机现象就是向平面区域D中随机投点,如果该点坐标(X,Y)落在D的子区域G中的概率只与G的面积有关,而与G的位置无关.则

(4)二元正态分布

如果二维随机变量(X,Y)的联合密度函数为

则称(X,Y)服从二元正态分布,记为(X,Y)~N(μ1,μ2,σ12,σ22,ρ).其中五个参数的取值范围分别是

-∞<μ1,μ2<∞,σ1、σ1>0,-1≤ρ≤1.

注:μ1,μ2分别是X与Y的均值,σ12,σ22分别是X与Y的方差,ρ是X与Y的相关系数.

二、边际分布与随机变量的独立性

1边际分布函数

如果在二维随机变量(X,Y)的联合分布函数F(x,y)中令y→∞,由于{Y<∞}为必然事件,故可得

这是由(X,Y)的联合分布函数F(X,Y)求得的X的分布函数,被称为X的边际分布,记为FX(X)=F(X,∞).

类似地,在F(X,Y)中令x→∞,可得Y的边际分布FY(y)=F(∞,y).

2边际分布列

在二维离散随机变量(X,Y)的联合分布列{P(X=xi,Y=yj)}中,对j求和所得的分布列

被称为X的边际分布列.

类似地,对i求和所得的分布列

称为Y的边际分布列.

3边际密度函数

如果二维连续随机变量(X,Y)的联合密度函数为p(x,y),因为

其中pX(x)和pY(y)分别为

它们恰好处于密度函数位置,故称上式给出的pX(x)为X的边际密度函数,pY(y)为Y的边际密度函数.

注意:由联合密度函数求边际密度函数时,要注意积分区域的确定.具有相同边际分布的多维联合分布可以是不同的.

4随机变量间的独立性

定义:设n维随机变量(X1,X2,…,Xn)的联合分布函数为F(x1,x2,…,xn),Fi(xi)为Xi的边际分布函数.如果对任意n个实数X1,X2,…,Xn,有

则称X1,X2,…,Xn相互独立.

对于离散随机变量,如果对其任意n个实数x1,x2,…,xn,有

则称X1,X2,…,Xn相互独立.

对于连续随机变量,如果对任意n个实数x1,x2,…,xn,有

则称X1,X2,…,Xn相互独立.

注意:证明随机变量是否独立时,常用定义来证明.

三、多维随机变量函数的分布

1多维离散随机变量函数的分布

设(X1,X2,…,Xn)为n维离散随机变量,则某一函数Y=g(X1,X2,…,Xn)是一维离散随机变量.当(X1,X2,…,Xn)所有可能取值较少时,可将Y的取值一一列出,然后再合并整理就可得出结果.

2最大值与最小值的分布

(1)最大值分布:Y=max{X1,X2,…,Xn}的分布函数为

(2)最小值分布:Y=min{X1,X2,…,Xn}的分布函数为

3连续场合的卷积公式

定理:设X与Y是两个相互独立的连续随机变量,其密度函数分别为pX(x)和pY(y),则其和Z=X+Y的密度函数为

注意:

(1)二项分布的可加性:设随机变量X~b(n,p),Y~b(m,p),且X与Y独立,则Z=X+Y~b(n+m,p).

(2)伽马分布的可加性:设随机变量X~Ga(α1,λ),Y~Ga(α2,λ),且X与Y独立,则

Z=X+Y~Ga(α1+α2,λ).

(3)m个独立同分布的指数变量之和为伽玛变量,即

(4)m个独立的χ2变量之和为χ2变量(χ2分布的可加性),即

χ2(n1)*χ2(n2)*…*χ2(nm)=χ2(n1+n2+…+nm

4变量变换法

(1)变量变换法

设二维随机变量(X,Y)的联合密度函数为p(x,y),如果函数

有连续偏导数,且存在唯一的反函数

其变换的雅可比行列式

则(U,V)的联合密度函数为p(u,v)=p(x(u,v),y(u,v))|J|.

(2)增补变量法

增补变量法是变量变换法的变形,为了求出二维连续随机变量(X,Y)的函数u=g(X,Y)的密度函数,增补一个新的随机变量y=h(X,Y),一般令V=X或V=Y.先用变换法求出(U,V)的联合密度函数p(u,v),再对p(u,v)关于v积分,从而得出关于U的边际密度函数.

下面有两个使用的公式:

积的公式:设随机变量X与Y相互独立,其密度函数分别为pX(x)和pY(y).则U=XY的密度函数为

商的公式:设随机变量X与Y,相互独立,其密度函数分别为pX(x)和pY(y).则U=X/Y的密度函数为

四、多维随机变量的特征数

1多维随机变量函数的数学期望

定理:若二维随机变量(X,Y)的分布用联合分布列P(X=xi,Y=yj)或用联合密度函数p(x,y)表示,则Z=g(X,Y)的数学期望为

这里所涉及的数学期望都假设存在.

在连续场合(离散场合也类似)有:

(1)当g(X,Y)=X时,可得X的数学期望为

(2)当g(X,Y)=(X-E(X))2时,可得X的方差为

类似地可给出Y的数学期望与方差的公式.

注意:利用以上定理,虽然可以省略求随机变量函数的分布,但在某些场合所涉及的求和或求积难以计算,此时只能分两步进行:先求随机变量函数Z=g(X1,X2,…,Xn)的分布;由Z的分布去求E(Z).

2数学期望与方差的运算性质

(1)设(X,Y)是二维随机变量,则有E(X+Y)=E(X)+E(Y).简述为“和的期望等于期望的和”,推广到n维随机变量场合,即

E(X1+X2+…+Xn)=E(X1)+E(X2)+…+E(Xn

(2)若随机变量X与Y相互独立,则有E(XY)=E(X)E(Y).简述为:在独立场合,随机变量乘积的数学期望等于数学期望的乘积,推广到n维随机变量场合,即若X1,X2,…,Xn相互独立,则有

E(X1X2…Xn)=E(X1)E(X2)…E(Xn

(3)若随机变量X与Y相互独立,则有Var(X±Y)=Var(X)+Var(Y).表明独立变量代数和的方差等于各方差之和.

注意:此性质对标准差不成立,即σ(X+Y)≠σ(X)+σ(Y).独立变量代数和的标准差只能通过“先方差,后标准差”求得,即

(4)推广到n维随机变量场合,即若X1,X2,…,Xn相互独立,则有

Var(X1±X2±…±Xn)=Var(X1)+Var(X2)+…+Var(Xn).

这表明对独立随机变量来说,它们之间无论是相加或相减,其方差总是逐个累积起来,只会增加,不会减少.

对于n个相互独立同分布(方差为σ2)的随机变量X1,X2,…,Xn,其算术平均的方差为

3协方差

(1)定义:设(X,Y)是一个二维随机变量,若E[(X-E(X))(Y-E(Y))]存在,则称此数学期望为X与Y的协方差,或称为X与Y的相关(中心)矩,并记为

Cov(X,Y)= E[(X-E(X))(Y-E(Y))];

特别有Cov(X,X)=Var(X).

注意:协方差可正可负,也可为零.

(2)性质:Cov(X,Y)=E(XY)-E(X)E(Y).

(3)若随机变量X与Y相互独立,则Cov(X,Y)=0.反之不然.(表明“不相关”是比“独立”更弱的一个概念,因为相关性只是指一种线性关系,而独立性则是一种更广的关系,包括平方关系,对数关系).

(4)对任意二维随机变量(X,Y),有

Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y)

推广到更多个随机变量场合,即对任意n个随机变量X1,X2,…,Xn,有

(5)协方差Cov(X,Y)的计算与X,Y的次序无关,即Cov(X,Y)=Cov(Y,X).

(6)任意随机变量X与常数a的协方差为零,即Cov(X,a)=0.

(7)对任意常数a,b,有Cov(aX,bY)=abCov(X,Y).

(8)设X,Y,Z是任意三个随机变量,则Cov(X+Y,Z)=Cov(X,Z)+ Cov(Y,Z).

4相关系数

协方差是有量纲的,而相关系数是没有的.

(1)定义:设(X,Y)是一个二维随机变量,Var(X)=σX2>0,Var(Y)=σY2>0.则称

为X与Y的(线性)相关系数.

从中可以看出:相关系数Corr(X,Y)与协方差Cov(X,Y)是同符号的,即同为正,或同为负,或同为零.这说明,从相关系数的取值也可反映出X与Y的正相关、负相关和不相关.

(2)引理:二维随机变量(X,Y),若X与Y的方差都存在,且记σX2=Var(X),σY2=Var(Y),则有[Cov(X,Y)]2≤σX2σY2

(3)性质:-1≤Corr(X,Y)≤1或|Corr(X,Y)|≤1.

这个性质表明:相关系数介于-1与1之间.

(4)性质:Corr(X,Y)=±1的充要条件是X与Y间几乎处处有线性关系,即存在a(≠0)与b,使得P(Y=aX+b)=1其中当Corr(X,Y)=1时,有a>0;当Corr(X,Y)=-1时,有a<0.

小结论:一般场合,独立必导致不相关,但不相关推不出独立.

(5)性质:在二维正态分布N(μ1,μ2,σ12,σ22,ρ)场合,不相关与独立是等价的.

5随机向量的数学期望向量与协方差矩阵

(1)定义:记n维随机向量为X=(X1,X2,…,Xn)′若其每个分量的数学期望都存在,则称E(X)=(E(X1),E(X2),…,E(Xn))′为n维随机向量X的数学期望向量,简称为X的数学期望,而称

为该随机向量的方差一协方差矩阵,简称协方差阵,记为Cov(X).

(2)定理:n维随机向量的协方差矩阵Cov(X)=(Cov(Xi,Xj))n×n是一个对称的非负定矩阵.

五、条件分布与条件期望

1条件分布

对二维随机变量(X,Y)而言,随机变量X的条件分布,就是在给定Y取某个值的条件下X的分布.

(1)离散随机变量的条件分布

定义:对一切使的yi,称

为给定Y=yj条件下X的条件分布列.

同理,对一切使的xi,称

为给定X=xi条件下Y的条件分布列.

(2)离散随机变量的条件分布函数

定义:给定Y=y条件下X的条件分布函数为

给定X=x条件下Y的条件分布函数为

2连续随机变量的条件分布

定义:对一切使PY(y)>0的y,给定Y=y条件下X的条件分布函数和条件密度函数分别为

同理对一切使PX(x)>0的x,给定X=x条件下Y的条件分布函数和条件密度函数分别为:

注意:条件分布函数F(x|y)和条件密度函数P(x|y),都还是条件Y=y的函数,不同的条件(如Y=y1和Y=y2)下,其分布函数F(x|y1)和F(x|y2)是不同的,条件密度函数p(x|y1)和p(x|y2)也是不同的.

小结:二维正态分布的边际分布和条件分布都是一维正态分布.

3连续条件下的全概率公式和贝叶斯公式

(1)全概率公式:密度函数形式:

(2)贝叶斯公式:密度函数形式:

注意:由边际分布无法得到联合分布,但由边际分布和条件分布就可以得到联合分布.另外,联合分布一样,边际分布不一定一样,反之,亦然.

4条件数学期望

条件分布的数学期望称为条件数学期望,它的定义如下: