生成函数、矩母函数与随机变量和
前面一章用卷积直接处理随机变量函数和随机变量和。卷积的优点是忠实、可见,缺点是算起来容易散开。本章换一个角度:把一个分布编码成一个函数,让“求和”变成“函数相乘”,再从函数的导数里读出矩。
本章有三条主线。第一条是概率生成函数,适合非负整数型随机变量;第二条是矩母函数,适合在零点附近有指数矩的随机变量;第三条是特征函数,它总是存在,是后续学习更一般极限定理时的入口。
为什么要把分布装进函数
设 X 和 Y 是独立随机变量。若我们只看分布本身,S=X+Y 的概率通常要通过卷积计算。离散情形是求和,连续情形是积分:
P(S=k)=j∑P(X=j)P(Y=k−j)
fS(s)=∫−∞∞f
生成函数的思想是:先把分布变成一个函数,再在函数层面做代数运算。对独立和来说,卷积对应的复杂求和会变成乘法。最后如果需要概率、期望或方差,再从生成函数中读出来。
本章的“生成”不是说函数凭空创造随机变量,而是说函数把一串概率或一串矩组织起来。PGF 组织非负整数点上的概率,MGF 组织普通矩,特征函数组织一种带振荡权重的平均。
PGF 的幂级数系数就是对应取值的概率,所以它特别适合计数型随机变量。
PGF:系数、导数与离散和
若 X 只取非负整数 0,1,2,…,它的概率生成函数定义为
GX(s)=E[sX]=k=0
这里 s 是一个辅助变量。把 GX(s) 展开成幂级数后,sk 前面的系数就是 P(X=。因此,如果知道 ,就能恢复整个分布:
P(X=k)=k!GX(k)(
PGF 在 s=1 附近的导数还能给出阶乘矩。只要相应期望有限,
GX(1)=1
GX′(1)=E[X]
GX′′(1)=E[X(X−1)]
于是方差可以写成
Var(X)=GX′′(1)+G
这个公式里出现的是 E[X(X−1)],不是 E[X2]。它们的关系是
X2=X(X−1)+X
PGF 默认用于非负整数型随机变量。若随机变量可能取负值或连续值,直接写 ∑kP(X=k)sk 就不再合适。此时通常改用 MGF 或特征函数。
下面的交互可以拖动参数,观察 PGF 的系数、s=1 处导数和阶乘矩之间的关系。
MGF:零点附近读取普通矩
矩母函数定义为
MX(t)=E[etX]
只要 MX(t) 在 t=0 的某个开区间内有限,就可以把它看成一个很有用的分布编码。因为指数函数的泰勒展开是
etX=1+tX+2!t
在可以交换期望和求导的条件下,MGF 的各阶导数给出普通矩:
MX(n)(0)=E[Xn]
特别地,
MX(0)=1
MX′(0)=E[X]
MX′′(0)=E[X2]
所以
Var(X)=MX′′(0)−{MX
MGF 在 t=0 附近的导数依次读出 E[X]、E[X2] 等普通矩。
有时我们也使用对数矩母函数
KX(t)=logMX(t)
它的前两阶导数有直接含义:
KX′(0)=E[X]
KX′′(0)=Var(X)
对数矩母函数的好处是独立和会变成加法。若 S=X1+⋯+Xn 且这些随机变量相互独立,则
KS(t)=KX1(t)
下面的交互把常见分布的 MGF 画在 t=0 附近,并显示导数如何对应均值和二阶矩。
独立和的乘法规则
设 X 与 Y 独立,S=X+Y。对 MGF 来说,
MS(t)=E[et(X+Y)]
因为指数把加法变成乘法,
et(X+Y)=etXetY
再用独立性拆开期望,得到
MS(t)=E[etX]E[e
PGF 也是同样的逻辑。若 X,Y 都是非负整数型,并且相互独立,
GX+Y(s)=GX(s)GY(
独立性让期望可以拆开,指数或幂函数让和变成乘积。
“和的生成函数等于生成函数的乘积”需要独立性。若 Y=X,则 X+Y=2X,一般不会有 M2。这类错误常见于只记住公式、忘了公式条件的时候。
多个独立随机变量也是同理。若 Sn=X1+⋯+Xn,且 相互独立,则
MSn(t)=i=1∏n
若它们还同分布,且共同 MGF 为 MX(t),则
MSn(t)={MX(t)}
随机个数的和也可以用 PGF 处理。设 N 是非负整数型随机变量,X1,X2,… 是独立同分布的非负整数型随机变量,并且 N 与所有 独立。令
S=X1+⋯+XN
其中 N=0 时约定 S=0。条件在 N=n 上,
GS∣N=n(s)={GX(s)}n
再对 N 取平均:
GS(s)=E[{GX(s)}N
这个公式是复合分布和随机和模型的核心。保险理赔总额、一天内顾客购买件数、网络请求总包数等模型都会遇到这种结构。
下面的模拟器把卷积、PGF 乘法和 MGF 乘法放在同一个画面里。它也能提醒你:一旦没有独立性,乘法规则就不能直接用。
常见分布的生成函数
下面的表只列最常用的形式。表中的几何分布采用“首次成功前失败次数”的版本,取值为 0,1,2,…。Gamma 分布采用 rate 参数 λ,密度中有 e−λx。
二项分布的生成函数是 Bernoulli 生成函数的 n 次方。
这个表能解释很多常见结论。例如,若 Xi∼Bernoulli(p) 相互独立,S=X1+,则
GS(s)=i=1∏n(1−p
这正是 Binomial(n,p) 的 PGF。因此 S∼Binomial(n,p)。
再看 Poisson。若
X∼Poisson(λ1)
Y∼Poisson(λ2)
且 X,Y 独立,则
MX+Y(t)=exp{λ1(e
MX+Y(t)=exp{(λ1+λ
所以
X+Y∼Poisson(λ1+λ2)
独立 Poisson 到达流合并后仍是 Poisson,参数变成 λ1+λ2。
例题:用生成函数算和
例题一:骰子点数和的 PGF
掷一枚公平骰子,令 X 为点数。它的 PGF 是
GX(s)=6s+s2+s
若独立掷两次,S=X1+X2,则
GS(s)=(6s+s
求 P(S=7)。
要找 P(S=7),就是找 GS(s) 中 的系数。两次点数和为 7 的有序组合为 。
这道题用普通计数也很快。PGF 的价值在于:当独立求和次数变多,或者分布不是均匀分布时,同一个思路仍然成立。
例题二:Gamma 同 rate 可加
设 X∼Gamma(α1,λ),Y∼Gamma(α2,并且 独立。用 MGF 证明 的分布。
Gamma(α,λ) 的 MGF 是
M(t)=(λ
这里必须注意“同 rate”。如果两个 Gamma 分布的 rate 不同,MGF 相乘后通常不能合成同一个 Gamma 分布的 MGF。
例题三:随机和的均值
设 N∼Poisson(λ),X1,X2,… 独立同分布且与 独立。每个 是非负整数型,PGF 为 。令
S=X1+⋯+XN
前面得到
GS(s)=GN(GX(s))
Poisson(λ) 的 PGF 为
GN(u)=exp{λ(u−1)}
所以
GS(s)=exp{λ(GX(s)−1)}
对 s 求导:
GS′(s)=exp{λ(GX(s)−
令 s=1,由于 GX(1)=1,
E[S]=GS′(1)=λGX
这个结果和全期望公式一致:
E[S]=E[E[S∣N]]=E[NE[X1]]
MGF 的存在性与特征函数入口
MGF 很强,但它不是总能用。定义里有 etX,当 t>0 时,右尾较重的分布会被指数权重放大;当 t<0 时,左尾较重的分布会被放大。某些分布的 M 可能只在 有限,这时它无法在零点附近唯一刻画分布。
使用 MGF 前要先看它是否在 0 的某个开邻域内有限。
“MGF 相等推出分布相同”通常要求两个 MGF 在 t=0 的某个开区间内都存在,并且在该区间相等。只在单个点 t=0 有限没有判定力,因为所有随机变量都有 MX(0)=1。
特征函数避开了这个问题。它定义为
φX(t)=E[eitX]
其中 i2=−1。因为
∣eitX∣=1
所以 φX(t) 对所有实数 t 都存在。特征函数也有独立和乘法规则:
φX+Y(t)=φX(t)φY
条件仍然是 X,Y 独立。
特征函数用单位圆上的有界振荡代替指数增长,因此总是存在。
在本课程里,你只需要把特征函数看成更稳健的 MGF 替代品。后续学习中心极限定理的严格证明时,特征函数会成为处理标准化和极限分布的主要工具。
方法清单与常见错误
遇到随机变量和的问题,可以按下面的顺序判断。
先判断随机变量是否独立。若没有独立性,不能直接把 PGF、MGF 或特征函数相乘。
再判断随机变量类型。非负整数型优先考虑 PGF;连续型或一般实值随机变量可以考虑 MGF。
使用 MGF 前检查存在区间。若 MGF 在 0 的邻域内不存在,改用特征函数,或者回到卷积、条件分布等方法。
常见错误集中在四处。
- 把 PGF 用到可能取负值或连续取值的随机变量上。
- 忘记独立性,直接写 MX+Y=MXMY。
- 只记住 ,却把 当成方差;它其实是 。
练习
- 设 X∼Poisson(3),Y∼Poisson(5),且 X,Y 独立。求 X+ 的分布。
用 MGF 或 PGF 都可以。Poisson(λ) 的 MGF 是
exp{λ(et−1)}所以
- 设 X∼Binomial(n,p)。用 PGF 求 E[X] 和 Var(X)。
二项分布的 PGF 是
GX(s)=(1−p+ps)n求导:
- 设 X1,…,Xn 独立同分布,且 MX(t) 在 附近存在。令 。写出 的 MGF,并说明如何求 。
独立同分布给出
MSn(t)={MX(t)}
- 设 X∼Exponential(λ)。它的 MGF 为 λ−tλ。为什么不能说这个公式对所有 t 都成立?
因为
MX(t)=E[etX]对指数分布计算时,需要积分
∫
- 设 N 是非负整数型随机变量,X1,X2,… 独立同分布且与 N 独立。若 ,写出 的 PGF。
条件在 N=n 上,
GS∣N=n(s)={GX