独立性、条件独立与重复试验
独立性说的不是两个事件“看起来没有关系”,而是一个事件发生后,另一个事件的概率没有改变。这个定义很朴素,却会在很多题目里被误用:互斥常被误认为独立,两两独立常被误认为相互独立,条件独立又常被当成普通独立。
本章把这些概念放在同一条主线上:信息是否改变概率。先判断两个事件,再推广到多个事件;先看普通独立,再看给定条件后的独立;最后用 Bernoulli 重复试验说明独立性如何变成可计算的概率模型。
互斥、独立与条件独立描述的是三种不同的事件关系:不能同时发生、概率互不改变,以及在给定条件后不再提供额外信息。
从信息不变看两事件独立
设 A 与 B 是同一个概率空间中的两个事件。若
P(A∩B)=P(A)P(B)
就说 A 与 B 独立。
这个等式的直观意思是:同时发生的概率刚好等于两个单独概率的乘积。若 P(B)>0,它等价于
P(A∣B)=P(A)
也就是说,知道 B 已经发生,并没有改变 A 发生的概率。同理,若 P(A)>0,也有 P(B∣A)=P(B)。
独立性是概率模型中的陈述,不是现实世界中的口头判断。两个变量在现实中“似乎无关”并不能自动推出独立;题目给出机制、抽样方式或概率等式时,才有足够信息使用独立性。
独立事件的面积模型:当 A 与 B 独立时,交叠面积等于 A 的面积与 B 的面积之积。
下面的交互可以把 P(A)、P(B) 和 P(A∩B) 放在同一个面积模型里比较。
一个掷骰子的判断
掷一枚公平骰子。令 A={2,4,6} 表示“点数为偶数”,令 B={1,2,3,4} 表示“点数不超过 4”。判断 A 与 是否独立。
先计算单个事件概率。样本空间有 6 个等可能结果,A 有 3 个结果,所以 P(A)=1/2;B 有 4 个结果,所以 P(。
这道题也可以用条件概率看:已知点数不超过 4 后,可能结果是 {1,2,3,4},其中偶数仍占一半,所以 P(A∣B)=1/2=P(A)。
互斥不是独立
互斥事件满足 A∩B=∅,所以 P(A∩B)=0。如果 P(A)>0 且 ,那么 ,两边不可能相等。因此,两个概率都为正的互斥事件一定不独立。
掷骰子时,“点数为偶数”和“点数为奇数”互斥。知道点数为偶数后,点数为奇数的概率从 1/2 变成 0。概率发生了变化,所以它们不是独立事件。
互斥并不等于独立;当 P(A)>0 且 P(B)>0 时,互斥通常意味着不独立。
“没有重叠”不是独立的意思。对概率都为正的事件来说,没有重叠反而说明一个事件发生会排除另一个事件,信息改变得最彻底。
只有在边界情况下,互斥才可能同时满足独立。例如 P(A)=0 或 P(B)=0 时,P(A∩B)=。这类情况在计算上成立,但不代表日常直觉中的“互不影响”。
多事件独立:两两不够
三个事件 A,B,C 两两独立,指的是
P(A∩B)=P(A)P(B)
P(A∩C)=P(A)P(C)
P(B∩C)=P(B)P(C)
但这还不够。三个事件相互独立,还必须满足
P(A∩B∩C)=P(A)P(B)P(C)
对于更多事件,相互独立要求任意一组事件的交集概率都等于各自概率的乘积。这个要求看起来严格,是因为“每两个事件不互相改变概率”并不能保证“一组事件合起来也不改变概率”。
两两独立但不相互独立的经典反例:A、B、C 任意两件独立,但 P(A∩B∩C)=1/4,而 。
两枚硬币的经典反例
同时掷两枚公平硬币,样本空间为 {HH,HT,TH,TT}。定义:
- A:第一枚为正面;
- B:第二枚为正面;
- C:两枚硬币同面。
每个事件的概率都是 1/2。成对来看,
P(A∩B)=P(A∩C)=P(B∩C)=
而每一对的概率乘积都是 (1/2)(1/2)=1/4。所以它们两两独立。
但三个事件同时发生只有 HH 一种结果:
P(A∩B∩C)=41
同时,
P(A)P(B)P(C)=81
两者不相等,因此 A,B,C 不相互独立。
这个反例提醒我们:若题目说“事件 A1,…,An 独立”,通常默认是相互独立;若只知道“两两独立”,不能直接把全部事件的交集写成概率乘积。
条件独立
条件独立是在给定某个事件或信息后,再讨论独立性。若 P(C)>0,且
P(A∩B∣C)=P(A∣C)P(B∣C)
就说 A 与 B 在给定 C 的条件下独立。
当 P(B∩C)>0 时,也可以写成
P(A∣B∩C)=P(A∣C)
也就是说,在已经知道 C 的前提下,再知道 B 并不会改变 A 的概率。
共同原因 C 会使 A 与 B 表现出相关;在给定 C 后比较,剩余关联消失,即 P(A∩B∣。
条件独立不是普通独立的弱版本,也不是普通独立的自动结果。它只在给定条件的那一层样本空间内成立。去掉条件后,结论可能变成相关;换一个条件后,结论也可能失效。
两个检测结果的例子
设 D 表示某人患病,T1 与 T2 表示两个检测结果为阳性。假设在给定是否患病后,两个检测的误差来源可以看成独立:
P(T1∩T2∣D)=P(T
P(T1∩T2∣Dc
这并不表示 T1 与 T2 在总体中独立。因为两个检测都受同一个隐藏状态 D 影响:若一个检测阳性,通常会提高“这个人患病”的概率,从而也提高另一个检测阳性的概率。
用具体数值看得更清楚。设 P(D)=0.1,P(T1∣D)=0.9,,,。在条件独立假设下,
P(T1∩T2)=0.1×0.9×0.8
而
P(T1)=0.18,P(T2)=0.125
所以
P(T1)P(T2)=0.0225
总体中 T1 与 T2 不独立,但在给定 D 或 Dc 后可以独立。这类结构在医学检测、分类器融合和贝叶斯网络中很常见。
Bernoulli 试验与独立重复试验
Bernoulli 试验是只有两个结果的随机试验,通常记为“成功”和“失败”。若成功概率为 p,失败概率就是 1−p。
把同一个 Bernoulli 试验重复 n 次,并且要求各次试验相互独立,就得到独立重复试验。若某个具体序列中有 k 次成功、n−k 次失败,独立性给出这个具体顺序的概率:
pk(1−p)n−k
若只关心成功次数 X,而不关心成功出现在哪些位置,就要把所有含 k 次成功的顺序加起来。这样的顺序有 (kn) 个,所以
P(X=k)=(kn)pk(1
这就是二项模型的来源。
Bernoulli 重复试验中,固定一个具体成功失败顺序的概率为 pk(1−p)n−k,再乘以选择 k 个成功位置的方式数 (,得到二项计数公式。
二项模型不是“看到成功和失败就能用”。它需要每次试验只有两类结果、成功概率相同、各次试验独立,并且 X 只记录成功次数。
抽样方式如何影响独立性
从一个盒子中抽球,抽完放回并充分混合,下一次抽到红球的概率不受上一次结果影响;在模型中,这通常可以看成独立重复试验。
如果抽完不放回,情况就不同。第一次抽到红球会减少盒中红球数量,第二次抽到红球的条件概率随之改变。这样的试验不是独立重复试验,成功次数也不服从二项分布,而会通向后面要学习的超几何模型。
判断独立性的工作顺序
面对题目时,不要先凭直觉猜“有关”或“无关”。更稳妥的顺序是先找概率空间,再找事件,再比较等式。
明确事件定义。独立性讨论的是同一个概率空间中的事件,先把 A、B、C 写清楚,避免把现实描述直接当成数学对象。
计算或识别单个事件概率。若题目给出抽样机制、概率树或表格,先得到 、 这类边缘概率。
下面的表格把常见场景放在一起比较。
练习
练习:互斥与独立
在掷一枚公平骰子时,令 A={1,2},B={3,4}。判断 A 与 B 是否互斥,是否独立。
它们互斥,因为 A∩B=∅。但它们不独立,因为 P(A)=1/3,P(B)=1/3,而 。知道 发生后, 的概率变成 。
练习:有放回与无放回
一个盒中有 3 个红球和 7 个白球。连续抽两次,令 A 表示第一次抽到红球,B 表示第二次抽到红球。分别判断“有放回”和“无放回”时 A 与 B 是否独立。
有放回时,P(A)=3/10,P(B)=3/10,且 P(B∣A)=,所以独立。无放回时,,不同于 ,所以不独立。
练习:条件独立能否去掉条件
设两个检测 T1,T2 在给定患病状态 D 后独立,在给定未患病状态 Dc 后也独立。能否推出 与 在总体中独立?
不能。患病状态是两个检测结果的共同原因。一个检测阳性会改变对 D 的判断,进而改变另一个检测阳性的概率。条件独立只说明在固定 D 或 Dc 的层内,两个检测误差可以相乘;它不自动推出总体独立。
练习:什么时候可以用二项公式
某工厂每天抽检 20 件产品,记录不合格件数。若生产线在一天内状态稳定,每件产品是否合格可近似看成独立且不合格概率相同,可以用二项模型。若生产线经常在同一天内从正常状态切换到故障状态,还能直接用同一个二项模型吗?
不能直接用。状态切换会让同一天内产品之间出现共同原因:故障状态下相邻产品更容易同时不合格,独立性和相同概率都可能失效。可以先按生产线状态分层,或建立更细的条件模型。
本章小结
独立性的核心判断是“信息是否改变概率”。两事件独立可以用 P(A∩B)=P(A)P(B),也可以用条件概率不变来理解。互斥通常不是独立;两两独立也不等于相互独立。
条件独立要求把所有概率都放在同一个条件下比较。它常用来描述“给定共同原因后,剩余误差互不影响”的结构,但不能随意去掉条件。
Bernoulli 独立重复试验把独立性变成乘法,把相同成功概率变成统一的 p,再用组合数汇总成功位置。后面学习二项分布、几何分布、Poisson 近似和大数定律时,这一章的独立性假设会反复出现。