独立性、条件独立与重复试验

独立性说的不是两个事件“看起来没有关系”，而是一个事件发生后，另一个事件的概率没有改变。这个定义很朴素，却会在很多题目里被误用：互斥常被误认为独立，两两独立常被误认为相互独立，条件独立又常被当成普通独立。

本章把这些概念放在同一条主线上：信息是否改变概率。先判断两个事件，再推广到多个事件；先看普通独立，再看给定条件后的独立；最后用 Bernoulli 重复试验说明独立性如何变成可计算的概率模型。

三栏对比互斥、独立与条件独立的概率关系示意图，分别展示不相交事件、重叠独立事件和给定条件 C 后的条件独立关系。 — 互斥、独立与条件独立描述的是三种不同的事件关系：不能同时发生、概率互不改变，以及在给定条件后不再提供额外信息。

从信息不变看两事件独立

设 $A$ 与 $B$ 是同一个概率空间中的两个事件。若

P(A \cap B)=P(A)P(B)

就说 $A$ 与 $B$ 独立。

这个等式的直观意思是：同时发生的概率刚好等于两个单独概率的乘积。若 $P(B)>0$ ，它等价于

P(A \mid B)=P(A)

也就是说，知道 $B$ 已经发生，并没有改变 $A$ 发生的概率。同理，若 $P(A)>0$ ，也有 $P(B \mid A)=P(B)$ 。

独立性是概率模型中的陈述，不是现实世界中的口头判断。两个变量在现实中“似乎无关”并不能自动推出独立；题目给出机制、抽样方式或概率等式时，才有足够信息使用独立性。

单位正方形样本空间中，事件 A 为竖向带、事件 B 为横向带，交叠区域 A∩B 表示独立事件满足 P(A∩B)=P(A)P(B)，例子为 0.4×0.5=0.2。 — 独立事件的面积模型：当 $A$ 与 $B$ 独立时，交叠面积等于 $A$ 的面积与 $B$ 的面积之积。

下面的交互可以把 $P(A)$ 、 $P(B)$ 和 $P(A \cap B)$ 放在同一个面积模型里比较。

一个掷骰子的判断

掷一枚公平骰子。令 $A=\{2,4,6\}$ 表示“点数为偶数”，令 $B=\{1,2,3,4\}$ 表示“点数不超过 4”。判断 $A$ 与 $B$ 是否独立。

先计算单个事件概率。样本空间有 6 个等可能结果， $A$ 有 3 个结果，所以 $P(A)=1/2$ ； $B$ 有 4 个结果，所以 $P(B)=2/3$ 。

这道题也可以用条件概率看：已知点数不超过 4 后，可能结果是 $\{1,2,3,4\}$ ，其中偶数仍占一半，所以 $P(A \mid B)=1/2=P(A)$ 。

互斥不是独立

互斥事件满足 $A \cap B=\varnothing$ ，所以 $P(A \cap B)=0$ 。如果 $P(A)>0$ 且，那么，两边不可能相等。因此，两个概率都为正的互斥事件一定不独立。

掷骰子时，“点数为偶数”和“点数为奇数”互斥。知道点数为偶数后，点数为奇数的概率从 $1/2$ 变成 $0$ 。概率发生了变化，所以它们不是独立事件。

对比互斥与独立的概率教学图：互斥事件 A 与 B 不相交且 P(B|A)=0，独立事件 A 与 B 可重叠且 P(B|A)=P(B)。 — 互斥并不等于独立；当 $P(A)>0$ 且 $P(B)>0$ 时，互斥通常意味着不独立。

“没有重叠”不是独立的意思。对概率都为正的事件来说，没有重叠反而说明一个事件发生会排除另一个事件，信息改变得最彻底。

只有在边界情况下，互斥才可能同时满足独立。例如 $P(A)=0$ 或 $P(B)=0$ 时， $P(A \cap B)=P(A)P(B)=0$ 。这类情况在计算上成立，但不代表日常直觉中的“互不影响”。

多事件独立：两两不够

三个事件 $A,B,C$ 两两独立，指的是

P(A \cap B)=P(A)P(B)

P(A \cap C)=P(A)P(C)

P(B \cap C)=P(B)P(C)

但这还不够。三个事件相互独立，还必须满足

P(A \cap B \cap C)=P(A)P(B)P(C)

对于更多事件，相互独立要求任意一组事件的交集概率都等于各自概率的乘积。这个要求看起来严格，是因为“每两个事件不互相改变概率”并不能保证“一组事件合起来也不改变概率”。

两枚公平硬币的四个结果中，事件 A 为第一枚正面、B 为第二枚正面、C 为两枚同面，展示任意两件独立但三件不相互独立。 — 两两独立但不相互独立的经典反例： $A$ 、 $B$ 、 $C$ 任意两件独立，但 $P(A\cap B\cap C)=1/4$ ，而 $P$ 。

两枚硬币的经典反例

同时掷两枚公平硬币，样本空间为 $\{HH,HT,TH,TT\}$ 。定义：

$A$ ：第一枚为正面；
$B$ ：第二枚为正面；
$C$ ：两枚硬币同面。

每个事件的概率都是 $1/2$ 。成对来看，

P(A \cap B)=P(A \cap C)=P(B \cap C)=\frac14

而每一对的概率乘积都是 $(1/2)(1/2)=1/4$ 。所以它们两两独立。

但三个事件同时发生只有 $HH$ 一种结果：

P(A \cap B \cap C)=\frac14

同时，

P(A)P(B)P(C)=\frac18

两者不相等，因此 $A,B,C$ 不相互独立。

这个反例提醒我们：若题目说“事件 $A_1,\ldots,A_n$ 独立”，通常默认是相互独立；若只知道“两两独立”，不能直接把全部事件的交集写成概率乘积。

条件独立

条件独立是在给定某个事件或信息后，再讨论独立性。若 $P(C)>0$ ，且

P(A \cap B \mid C)=P(A \mid C)P(B \mid C)

就说 $A$ 与 $B$ 在给定 $C$ 的条件下独立。

当 $P(B \cap C)>0$ 时，也可以写成

P(A \mid B \cap C)=P(A \mid C)

也就是说，在已经知道 $C$ 的前提下，再知道 $B$ 并不会改变 $A$ 的概率。

条件独立与共同原因示意图，天气 C 同时影响路面湿 A 和打伞 B，给定 C 后 A 与 B 条件独立。 — 共同原因 $C$ 会使 $A$ 与 $B$ 表现出相关；在给定 $C$ 后比较，剩余关联消失，即 $P(A\cap B\mid C)=P(A\mid C)P(B\mid C)$ 。

条件独立不是普通独立的弱版本，也不是普通独立的自动结果。它只在给定条件的那一层样本空间内成立。去掉条件后，结论可能变成相关；换一个条件后，结论也可能失效。

两个检测结果的例子

设 $D$ 表示某人患病， $T_1$ 与 $T_2$ 表示两个检测结果为阳性。假设在给定是否患病后，两个检测的误差来源可以看成独立：

P(T_1 \cap T_2 \mid D)=P(T_1 \mid D)P(T_2 \mid D)

P(T_1 \cap T_2 \mid D^c)=P(T_1 \mid D^c)P(T_2 \mid D^c)

这并不表示 $T_1$ 与 $T_2$ 在总体中独立。因为两个检测都受同一个隐藏状态 $D$ 影响：若一个检测阳性，通常会提高“这个人患病”的概率，从而也提高另一个检测阳性的概率。

用具体数值看得更清楚。设 $P(D)=0.1$ ， $P(T_1 \mid D)=0.9$ ， $P(T_2 \mid D)=0.8$ ，，。在条件独立假设下，

P(T_1 \cap T_2)=0.1 \times 0.9 \times 0.8+0.9 \times 0.1 \times 0.05=0.0765

而

P(T_1)=0.18,\quad P(T_2)=0.125

所以

P(T_1)P(T_2)=0.0225

总体中 $T_1$ 与 $T_2$ 不独立，但在给定 $D$ 或 $D^c$ 后可以独立。这类结构在医学检测、分类器融合和贝叶斯网络中很常见。

Bernoulli 试验与独立重复试验

Bernoulli 试验是只有两个结果的随机试验，通常记为“成功”和“失败”。若成功概率为 $p$ ，失败概率就是 $1-p$ 。

把同一个 Bernoulli 试验重复 $n$ 次，并且要求各次试验相互独立，就得到独立重复试验。若某个具体序列中有 $k$ 次成功、 $n-k$ 次失败，独立性给出这个具体顺序的概率：

p^k(1-p)^{n-k}

若只关心成功次数 $X$ ，而不关心成功出现在哪些位置，就要把所有含 $k$ 次成功的顺序加起来。这样的顺序有 $\binom{n}{k}$ 个，所以

P(X=k)=\binom{n}{k}p^k(1-p)^{n-k},\quad k=0,1,\ldots,n

这就是二项模型的来源。

Bernoulli 重复试验时间轴示意图，展示每次试验成功概率 p、失败概率 1-p，某一具体顺序的概率和二项分布公式。 — Bernoulli 重复试验中，固定一个具体成功失败顺序的概率为 $p^k(1-p)^{n-k}$ ，再乘以选择 $k$ 个成功位置的方式数 $\binom{n}{k}$ ，得到二项计数公式。

二项模型不是“看到成功和失败就能用”。它需要每次试验只有两类结果、成功概率相同、各次试验独立，并且 $X$ 只记录成功次数。

抽样方式如何影响独立性

从一个盒子中抽球，抽完放回并充分混合，下一次抽到红球的概率不受上一次结果影响；在模型中，这通常可以看成独立重复试验。

如果抽完不放回，情况就不同。第一次抽到红球会减少盒中红球数量，第二次抽到红球的条件概率随之改变。这样的试验不是独立重复试验，成功次数也不服从二项分布，而会通向后面要学习的超几何模型。

判断独立性的工作顺序

面对题目时，不要先凭直觉猜“有关”或“无关”。更稳妥的顺序是先找概率空间，再找事件，再比较等式。

明确事件定义。独立性讨论的是同一个概率空间中的事件，先把 $A$ 、 $B$ 、 $C$ 写清楚，避免把现实描述直接当成数学对象。

计算或识别单个事件概率。若题目给出抽样机制、概率树或表格，先得到 $P(A)$ 、这类边缘概率。

下面的表格把常见场景放在一起比较。

场景	通常是否独立	原因
有放回抽样并充分混合	可以建模为独立	每次抽样前盒中组成恢复原状
无放回抽样	通常不独立	前一次结果改变后一次概率
连续抛同一枚硬币	常建模为独立	若抛掷机制稳定，前一次结果不改变下一次概率
同一台机器短时间连续测量	需要谨慎	温度、校准误差或批次状态可能形成共同原因
时间序列中的相邻涨跌	不能默认独立	过去状态可能影响未来状态

练习

练习：互斥与独立

在掷一枚公平骰子时，令 $A=\{1,2\}$ ， $B=\{3,4\}$ 。判断 $A$ 与 $B$ 是否互斥，是否独立。

它们互斥，因为 $A \cap B=\varnothing$ 。但它们不独立，因为 $P(A)=1/3$ ， $P(B)=1/3$ ，而 $P (A$ 。知道发生后，的概率变成。

练习：有放回与无放回

一个盒中有 3 个红球和 7 个白球。连续抽两次，令 $A$ 表示第一次抽到红球， $B$ 表示第二次抽到红球。分别判断“有放回”和“无放回”时 $A$ 与 $B$ 是否独立。

有放回时， $P(A)=3/10$ ， $P(B)=3/10$ ，且 $P(B \mid A)=3/10$ ，所以独立。无放回时，，不同于，所以不独立。

练习：条件独立能否去掉条件

设两个检测 $T_1,T_2$ 在给定患病状态 $D$ 后独立，在给定未患病状态 $D^c$ 后也独立。能否推出 $T_{}$ 与在总体中独立？

不能。患病状态是两个检测结果的共同原因。一个检测阳性会改变对 $D$ 的判断，进而改变另一个检测阳性的概率。条件独立只说明在固定 $D$ 或 $D^c$ 的层内，两个检测误差可以相乘；它不自动推出总体独立。

练习：什么时候可以用二项公式

某工厂每天抽检 20 件产品，记录不合格件数。若生产线在一天内状态稳定，每件产品是否合格可近似看成独立且不合格概率相同，可以用二项模型。若生产线经常在同一天内从正常状态切换到故障状态，还能直接用同一个二项模型吗？

不能直接用。状态切换会让同一天内产品之间出现共同原因：故障状态下相邻产品更容易同时不合格，独立性和相同概率都可能失效。可以先按生产线状态分层，或建立更细的条件模型。

本章小结

独立性的核心判断是“信息是否改变概率”。两事件独立可以用 $P(A \cap B)=P(A)P(B)$ ，也可以用条件概率不变来理解。互斥通常不是独立；两两独立也不等于相互独立。

条件独立要求把所有概率都放在同一个条件下比较。它常用来描述“给定共同原因后，剩余误差互不影响”的结构，但不能随意去掉条件。

Bernoulli 独立重复试验把独立性变成乘法，把相同成功概率变成统一的 $p$ ，再用组合数汇总成功位置。后面学习二项分布、几何分布、Poisson 近似和大数定律时，这一章的独立性假设会反复出现。

独立性、条件独立与重复试验 | 概率论 I | 自在学

P(B)>0

(

A

)

P

(

B

)

P

(

C

)

=

1

/

8

P(A)P(B)P(C)=1/8

\cap

B

)

=

0

\neq

1

/

9

P(A \cap B)=0 \ne 1/9

1

T_1