第3章　多维随机变量及其分布

3.1　复习笔记

一、多维随机变量及其联合分布

1多维随机变量

定义：如果X₁（ω），X₂（ω），…，X_n（ω）是定义在同一个样本空间Ω＝{ω}上的n个随机变量，则称X（ω）＝（X₁（ω），X₂（ω），…，X_n（ω））为n维（或n元）随机变量或随机向量．

2联合分布函数

（1）定义

对任意的n个实数x₁，x₂，…，x_n，则n个事件{X₁≤x₁}，{X₂≤x₂}，…，{X_n≤x_n}同时发生的概率F（x₁，x₂，…，x_n）＝P（X₁≤x₁，X₂≤x₂，…，X_n≤x_n）称为n维随机变量（X₁，X₂，…，X_n）的联合分布函数．

（2）联合分布函数F（x，y）的基本性质

①单调性：F（x，y）分别对x或y是单调非减的，即当x₁＜x₂时，有F（x₁，y）≤F（x₂，y），当y₁＜y₂时，有F（x，y₁）≤F（x，y₂）．

②有界性：对任意的x或y，有0≤F（x，y）≤1，且

③右连续性：对每个变量都是右连续的，即F（x＋0，y）＝F（x，y），F（x，y＋0）＝F（x，y）．

④非负性：对任意的a＜b，c＜d有

P（a＜X≤b，c＜Y≤d）＝F（b，d）－F（a，d）－F（b，c）＋F（a，c）≥0

3联合分布列

（1）定义：如果二维随机变量（X，Y）只取有限个或可列个数对（x_i，y_j），则称（X，Y）为二维离散随机变量，称P_ij＝P（X＝x_i，Y＝y_j），i，j＝1，2，…为（X，Y）的联合分布列，也可如下用表格形式记联合分布列

（2）联合分布列的基本性质：

①非负性：P_ij≥0；

②正则性：P_ij≥0，

求二维离散随机变量的联合分布列，关键是写出二维随机变量可能取的数对及其发生的概率．

4联合密度函数

（1）定义：如果存在二元非负函数P（x，y），使得二维随机变量（x，y）的分布函数F（x，y）可表示为

则称（X，Y）为二维连续随机变量，称P（u，v）为（X，Y）的联合密度函数．

若F（x，y）偏导数存在，则有联合密度函数

（2）联合密度函数的基本性质：

①非负性：p（x，y）≥0；

②正则性：

若G为平面上的一个区域，则事件{（X，Y）∈G}的概率可表示为在G上对p（x，y）的二重积分．

注：在使用上式时，关键是找出p（x，y）的非零区域与G的交集部分，确定积分区域，然后设法化成累次积分，最后计算出结果，计算中要注意如下事实，“直线的面积为零”，故积分区域的边界线是否在积分区域内不影响概率计算结果．

5常用多维分布

（1）多项分布

进行n次独立重复试验，如果每次试验有r个互不相容结果：A₁，A₂，…A_r，之一发生，且每次试验中A_i发生的概率为p_i＝P（A_i），i＝1，2，…，r，且p₁＋p₂＋…＋p_r＝1．记X_i为n次独立重复试验中A_i出现的次数，i＝1，2，…，r．则（X₁，X₂，…，X_r）取值（n₁，n₂，…，n_r）的概率，即A₁出现n₁次，A₂出现n₂次，……，A_r出现n_r次的概率为

这个联合分布列称为r项分布，又称多项分布，记为M（n，p₁，p₂，…，p_r）．这个概率是多项式（p₁＋p₂＋p_r）ⁿ展开式中的一项，故其和为1．多项分布是二项分布的推广，当r＝2时，即为二项分布．

（2）多维超几何分布

若袋中有N个球，其中有N_i个i号球，i＝1，2，…，r，且N＝N₁＋N₂＋…＋N_r，从中任意取出n个，若记X_i为取出的n个球中i号球的个数，i＝1，2，…，r，则

其中n₁＋n₂＋…＋n_r＝n

（3）多维均匀分布

设D为Rⁿ中的一个有界区域，其度量（平面的为面积，空间的为体积等）为S_D，如果多维随机变量（X₁，X₂，…，X_n）的联合密度函数为

则称（X₁，X₂，…，X_n）

服从D上的多维均匀分布，记为（X₁，X₂，…，X_n）～U（D）．

二维均匀分布所描述的随机现象就是向平面区域D中随机投点，如果该点坐标（X，Y）落在D的子区域G中的概率只与G的面积有关，而与G的位置无关．则

（4）二元正态分布

如果二维随机变量（X，Y）的联合密度函数为

则称（X，Y）服从二元正态分布，记为（X，Y）～N（μ₁，μ₂，σ₁²，σ₂²，ρ）．其中五个参数的取值范围分别是

－∞＜μ₁，μ₂＜∞，σ₁、σ₁＞0，－1≤ρ≤1．

注：μ₁，μ₂分别是X与Y的均值，σ₁²，σ₂²分别是X与Y的方差，ρ是X与Y的相关系数．

二、边际分布与随机变量的独立性

1边际分布函数

如果在二维随机变量（X，Y）的联合分布函数F（x，y）中令y→∞，由于{Y＜∞}为必然事件，故可得

这是由（X，Y）的联合分布函数F（X，Y）求得的X的分布函数，被称为X的边际分布，记为F_X（X）＝F（X，∞）．

类似地，在F（X，Y）中令x→∞，可得Y的边际分布F_Y（y）＝F（∞，y）．

2边际分布列

在二维离散随机变量（X，Y）的联合分布列{P（X＝x_i，Y＝y_j）}中，对j求和所得的分布列

被称为X的边际分布列．

类似地，对i求和所得的分布列

称为Y的边际分布列．

3边际密度函数

如果二维连续随机变量（X，Y）的联合密度函数为p（x，y），因为

其中p_X（x）和p_Y（y）分别为

它们恰好处于密度函数位置，故称上式给出的p_X（x）为X的边际密度函数，p_Y（y）为Y的边际密度函数．

注意：由联合密度函数求边际密度函数时，要注意积分区域的确定．具有相同边际分布的多维联合分布可以是不同的．

4随机变量间的独立性

定义：设n维随机变量（X₁，X₂，…，X_n）的联合分布函数为F（x₁，x₂，…，x_n），F_i（x_i）为X_i的边际分布函数．如果对任意n个实数X₁，X₂，…，X_n，有

则称X₁，X₂，…，X_n相互独立．

对于离散随机变量，如果对其任意n个实数x₁，x₂，…，x_n，有

则称X₁，X₂，…，X_n相互独立．

对于连续随机变量，如果对任意n个实数x₁，x₂，…，x_n，有

则称X₁，X₂，…，X_n相互独立．

注意：证明随机变量是否独立时，常用定义来证明．

三、多维随机变量函数的分布

1多维离散随机变量函数的分布

设（X₁，X₂，…，X_n）为n维离散随机变量，则某一函数Y＝g（X₁，X₂，…，X_n）是一维离散随机变量．当（X₁，X₂，…，X_n）所有可能取值较少时，可将Y的取值一一列出，然后再合并整理就可得出结果．

2最大值与最小值的分布

（1）最大值分布：Y＝max{X₁，X₂，…，X_n}的分布函数为

（2）最小值分布：Y＝min{X₁，X₂，…，X_n}的分布函数为

3连续场合的卷积公式

定理：设X与Y是两个相互独立的连续随机变量，其密度函数分别为p_X（x）和p_Y（y），则其和Z＝X＋Y的密度函数为

注意：

（1）二项分布的可加性：设随机变量X～b（n，p），Y～b（m，p），且X与Y独立，则Z＝X＋Y～b（n＋m，p）．

（2）伽马分布的可加性：设随机变量X～Ga（α₁，λ），Y～Ga（α₂，λ），且X与Y独立，则

Z＝X＋Y～Ga（α₁＋α₂，λ）．

（3）m个独立同分布的指数变量之和为伽玛变量，即

（4）m个独立的χ²变量之和为χ²变量（χ²分布的可加性），即

χ²（n₁）*χ²（n₂）*…*χ²（n_m）＝χ²（n₁＋n₂＋…＋n_m）

4变量变换法

（1）变量变换法

设二维随机变量（X，Y）的联合密度函数为p（x，y），如果函数

有连续偏导数，且存在唯一的反函数

其变换的雅可比行列式

若

则（U，V）的联合密度函数为p（u，v）＝p（x（u，v），y（u，v））|J|．

（2）增补变量法

增补变量法是变量变换法的变形，为了求出二维连续随机变量（X，Y）的函数u＝g（X，Y）的密度函数，增补一个新的随机变量y＝h（X，Y），一般令V＝X或V＝Y．先用变换法求出（U，V）的联合密度函数p（u，v），再对p（u，v）关于v积分，从而得出关于U的边际密度函数．

下面有两个使用的公式：

①积的公式：设随机变量X与Y相互独立，其密度函数分别为p_X（x）和p_Y（y）．则U＝XY的密度函数为

②商的公式：设随机变量X与Y，相互独立，其密度函数分别为p_X（x）和p_Y（y）．则U＝X/Y的密度函数为

四、多维随机变量的特征数

1多维随机变量函数的数学期望

定理：若二维随机变量（X，Y）的分布用联合分布列P（X＝x_i，Y＝y_j）或用联合密度函数p（x，y）表示，则Z＝g（X，Y）的数学期望为

这里所涉及的数学期望都假设存在．

在连续场合（离散场合也类似）有：

（1）当g（X，Y）＝X时，可得X的数学期望为

（2）当g（X，Y）＝（X－E（X））²时，可得X的方差为

类似地可给出Y的数学期望与方差的公式．

注意：利用以上定理，虽然可以省略求随机变量函数的分布，但在某些场合所涉及的求和或求积难以计算，此时只能分两步进行：①先求随机变量函数Z＝g（X₁，X₂，…，X_n）的分布；②由Z的分布去求E（Z）．

2数学期望与方差的运算性质

（1）设（X，Y）是二维随机变量，则有E（X＋Y）＝E（X）＋E（Y）．简述为“和的期望等于期望的和”，推广到n维随机变量场合，即

E（X₁＋X₂＋…＋X_n）＝E（X₁）＋E（X₂）＋…＋E（X_n）

（2）若随机变量X与Y相互独立，则有E（XY）＝E（X）E（Y）．简述为：在独立场合，随机变量乘积的数学期望等于数学期望的乘积，推广到n维随机变量场合，即若X₁，X₂，…，X_n相互独立，则有

E（X₁X₂…X_n）＝E（X₁）E（X₂）…E（X_n）

（3）若随机变量X与Y相互独立，则有Var（X±Y）＝Var（X）＋Var（Y）．表明独立变量代数和的方差等于各方差之和．

注意：此性质对标准差不成立，即σ（X＋Y）≠σ（X）＋σ（Y）．独立变量代数和的标准差只能通过“先方差，后标准差”求得，即

（4）推广到n维随机变量场合，即若X₁，X₂，…，X_n相互独立，则有

Var（X₁±X₂±…±X_n）＝Var（X₁）＋Var（X₂）＋…＋Var（X_n）．

这表明对独立随机变量来说，它们之间无论是相加或相减，其方差总是逐个累积起来，只会增加，不会减少．

对于n个相互独立同分布（方差为σ²）的随机变量X₁，X₂，…，X_n，其算术平均的方差为

3协方差

（1）定义：设（X，Y）是一个二维随机变量，若E[（X－E（X））（Y－E（Y））]存在，则称此数学期望为X与Y的协方差，或称为X与Y的相关（中心）矩，并记为

Cov（X，Y）＝ E[（X－E（X））（Y－E（Y））]；

特别有Cov（X，X）＝Var（X）．

注意：协方差可正可负，也可为零．

（2）性质：Cov（X，Y）＝E（XY）－E（X）E（Y）．

（3）若随机变量X与Y相互独立，则Cov（X，Y）＝0．反之不然．（表明“不相关”是比“独立”更弱的一个概念，因为相关性只是指一种线性关系，而独立性则是一种更广的关系，包括平方关系，对数关系）．

（4）对任意二维随机变量（X，Y），有

Var（X±Y）＝Var（X）＋Var（Y）±2Cov（X，Y）

推广到更多个随机变量场合，即对任意n个随机变量X₁，X₂，…，X_n，有

（5）协方差Cov（X，Y）的计算与X，Y的次序无关，即Cov（X，Y）＝Cov（Y，X）．

（6）任意随机变量X与常数a的协方差为零，即Cov（X，a）＝0．

（7）对任意常数a，b，有Cov（aX，bY）＝abCov（X，Y）．

（8）设X，Y，Z是任意三个随机变量，则Cov（X＋Y，Z）＝Cov（X，Z）＋ Cov（Y，Z）．

4相关系数

协方差是有量纲的，而相关系数是没有的．

（1）定义：设（X，Y）是一个二维随机变量，Var（X）＝σ_X²＞0，Var（Y）＝σ_Y²＞0．则称

为X与Y的（线性）相关系数．

从中可以看出：相关系数Corr（X，Y）与协方差Cov（X，Y）是同符号的，即同为正，或同为负，或同为零．这说明，从相关系数的取值也可反映出X与Y的正相关、负相关和不相关．

（2）引理：二维随机变量（X，Y），若X与Y的方差都存在，且记σ_X²＝Var（X），σ_Y²＝Var（Y），则有[Cov（X，Y）]²≤σ_X²σ_Y²．

（3）性质：－1≤Corr（X，Y）≤1或|Corr（X，Y）|≤1．

这个性质表明：相关系数介于－1与1之间．

（4）性质：Corr（X，Y）＝±1的充要条件是X与Y间几乎处处有线性关系，即存在a（≠0）与b，使得P（Y＝aX＋b）＝1其中当Corr（X，Y）＝1时，有a＞0；当Corr（X，Y）＝－1时，有a＜0．

小结论：一般场合，独立必导致不相关，但不相关推不出独立．

（5）性质：在二维正态分布N（μ₁，μ₂，σ₁²，σ₂²，ρ）场合，不相关与独立是等价的．

5随机向量的数学期望向量与协方差矩阵

（1）定义：记n维随机向量为X＝（X₁，X₂，…，X_n）′若其每个分量的数学期望都存在，则称E（X）＝（E（X₁），E（X₂），…，E（X_n））′为n维随机向量X的数学期望向量，简称为X的数学期望，而称

为该随机向量的方差一协方差矩阵，简称协方差阵，记为Cov（X）．

（2）定理：n维随机向量的协方差矩阵Cov（X）＝（Cov（X_i，X_j））_n_×_n是一个对称的非负定矩阵．

五、条件分布与条件期望

1条件分布

对二维随机变量（X，Y）而言，随机变量X的条件分布，就是在给定Y取某个值的条件下X的分布．

（1）离散随机变量的条件分布

定义：对一切使的y_i，称

为给定Y＝y_j条件下X的条件分布列．

同理，对一切使的x_i，称

为给定X＝x_i条件下Y的条件分布列．

（2）离散随机变量的条件分布函数

定义：给定Y＝y条件下X的条件分布函数为

给定X＝x条件下Y的条件分布函数为

2连续随机变量的条件分布

定义：对一切使P_Y（y）＞0的y，给定Y＝y条件下X的条件分布函数和条件密度函数分别为

同理对一切使P_X（x）＞0的x，给定X＝x条件下Y的条件分布函数和条件密度函数分别为：

小结：二维正态分布的边际分布和条件分布都是一维正态分布．

3连续条件下的全概率公式和贝叶斯公式

（1）全概率公式：密度函数形式：

（2）贝叶斯公式：密度函数形式：

注意：由边际分布无法得到联合分布，但由边际分布和条件分布就可以得到联合分布．另外，联合分布一样，边际分布不一定一样，反之，亦然．

4条件数学期望

条件分布的数学期望称为条件数学期望，它的定义如下：

第3章 多维随机变量及其分布

3.1 复习笔记

第3章　多维随机变量及其分布

3.1　复习笔记