- 机器学习教程(微课视频版)
- 张旭东编著
- 522字
- 2024-12-27 23:37:32
2.1.3 随机变量的统一表示
离散和连续随机变量尽管不同,但基本公式是相同的,例如全概率公式和条件概率公式等形式上是一致的,但求边际分布时,离散用求和,连续用积分,这种区别在后续很多应用中都是类似的。为了减少符号类型,尽管都用函数形式p(x),对离散随机变量,其表示X=x的概率值,但对连续随机变量来讲,其表示X=x的概率密度值,因为连续随机变量X=x的概率是无穷小量,故需要用概率密度表示。在机器学习中,遇到的对象既可能是离散的,也可能是连续的,均用p(x)表示其概率函数。
可以通过引入冲激函数δ(x),将取值连续和取值离散的随机变量统一用概率密度函数表示。对于离散随机变量X,其只可能取{x1,x2,…,xK}集合中的值,若P(X=xi)=pi,其概率密度函数可表示为
这里δ(x)称为冲激函数,是一个广义函数,由狄拉克给出的定义为
其最基本的性质为抽取性质,即f(t)δ(t)=f(0)δ(t),这里f(t)在t=0处连续,以及积分抽取性质。
例2.1.3 用X表示投一个硬币,仅取0、1值分别表示正面和反面,若两面出现概率相等,这是最简单的离散随机变量,利用冲激函数将概率密度函数写为
p(x)=0.5δ(x)+0.5δ(x-1)
对于离散随机变量,可以使用2.1.1节的概率函数表示,也可以使用冲激函数表示的概率密度函数表示。