
明天会不会下雨?下一班车会不会马上来?这枚硬币会朝哪一面?从一副洗好的牌里抽出红牌还是黑牌?
这些问题都有一个共同点:答案还没有出现,但我们并不是完全无话可说。我们能列出可能结果,能说清楚自己关心哪一类结果,也能用一个数表示它有多可能发生。概率的第一步,就是把这种“不确定”说得足够清楚。
本节先建立概率语言,不急着进入复杂计算。你要先练会三句话:可能结果有哪些?我关心哪些结果?这些结果有多可能?
如果把一枚普通硬币抛到空中,落下前你不知道它会是正面还是反面。可是你通常知道,它不会变成骰子,不会出现“红桃 A”,也不会显示明天的天气。
这就是概率问题和完全混乱的区别。概率处理的是有边界的不确定:结果还不知道,但可能结果的范围可以先说清楚。
注意,这里不是在说“世界很随机”。我们是在说:当结果还没发生,或者你还没观察到结果时,可以用概率语言来描述这种不确定。
接下来反复使用三个词:
这些词听起来有点正式,但它们做的事很朴素:先把“可能发生什么”摆在桌面上,再圈出“我关心什么”。

在概率里,“实验”不一定是实验室里的实验。只要你关心一个结果还没确定的过程,就可以把它看成一次随机实验。
随机实验的每一个具体结果叫做一个结果。所有可能结果合在一起,就是样本空间,常用 表示。
如果只抛一枚硬币,而且只记录正面或反面,那么样本空间是:
这看起来简单,但它已经做了一件重要的事:把问题的边界定下来了。
如果抛两枚硬币,并且区分“第一枚”和“第二枚”,样本空间是:
有同学会把“一个正面一个反面”只写成一种结果。这个写法适合回答“结果类型有几类”,但如果两枚硬币是分别抛出的, 和 是两个不同结果。它们对应不同的发生路径。
写样本空间时,不要急着合并看起来相似的结果。先问清楚:题目是否区分顺序、位置、时间或身份?如果区分,它们就可能是不同结果。
题目:先抛一枚硬币,再从只有一张红卡和一张黑卡的小盒中随机抽一张。请写出样本空间。
先确定这次随机实验有两个阶段:第一阶段是硬币,第二阶段是抽卡。每个最终结果都要同时包含这两个阶段的信息。
硬币有两个可能结果:正面、反面。抽卡也有两个可能结果:红卡、黑卡。每个硬币结果都可以和每个抽卡结果配成一个最终结果。
因此样本空间可以写成 。
最后检查是否漏掉或重复。这里一共有 个结果,每个结果都说明了硬币和卡片两个部分,所以样本空间完整。

事件是样本空间中的一部分结果。它可以很小,也可以很大;可以只包含一个结果,也可以包含很多结果。
继续看抛两枚硬币:
如果事件 表示“至少出现一个正面”,那么:
如果事件 表示“两枚都是反面”,那么:
事件的关键不是名字,而是它到底包含哪些结果。很多概率错误并不是算错了,而是事件一开始就圈错了。
日常问题通常不会直接说“事件 ”。它会说:
把日常语言翻译成事件,是概率学习里非常重要的一步。翻译越清楚,后面的计算越不容易偏。
概率是一个从 到 的数,用来描述事件发生的可能性。 表示不可能发生, 表示一定发生,靠近 表示更可能发生,靠近 表示更不可能发生。
在所有基本结果同样可能时,可以用“数结果”的方法计算:
这条式子很有用,但它有一个前提:样本空间里的基本结果必须同样可能。普通六面骰的 通常被看成同样可能;一枚明显偏重的硬币,正反两面就不能直接这样处理。
不要把“列出了几个结果”误认为“每个结果都同样可能”。例如“今天下雨”和“今天不下雨”虽然可以写成两个结果,但并不自动各占一半。
题目:抛两枚公平硬币。事件 是“至少出现一个正面”。求 。
先列出样本空间。区分两枚硬币的位置或先后时,,一共有 个同样可能的结果。
再圈出事件 。至少一个正面包括 、、,不包括 。
事件 包含 个结果,样本空间包含 个结果,所以:
这个答案表示:如果重复很多次抛两枚公平硬币,出现“至少一个正面”的比例会在长期中接近 。
题目:从一副普通扑克牌中随机抽一张。事件 是“抽到红色牌”。求 。
普通扑克牌有 张。如果不考虑大小王,红色牌包括红桃和方块,共 张。
抽牌时每张牌被抽到的机会相同,所以可以用“有利结果数除以总结果数”的方法。
这里的 来自牌的数量,而不是因为日常语言里只有“红色”和“黑色”两个词。

如果公平硬币正面的概率是 ,是不是每抛 次就一定有 次正面?不是。
短期结果会摇晃。抛 次出现 次正面并不奇怪,抛 次出现连续几次正面也不奇怪。概率说的是长期趋势:当重复次数越来越多,正面出现的累计比例通常会越来越接近 。
这就是长期频率的想法。概率可以被理解为大量重复试验中事件发生比例靠近的数。
把“长期接近”误读成“短期必须平均”,会带来很多错误判断。
例如,硬币已经连续出现了 次正面。下一次更可能是反面吗?
如果硬币公平,而且每次抛掷互不影响,那么下一次正面的概率仍然是:
连续正面看起来“该反过来了”,但公平硬币没有记忆。过去的结果不会自动补偿未来的结果。
长期频率会靠近概率,不代表随机过程会主动修正短期偏差。看到一串正面后说“该出反面了”,通常是在把长期规律误用到单次预测上。

硬币和骰子适合用“重复很多次”的方式理解概率。可是有些问题不能真的重复同一个明天。
例如天气预报说“明天本地降雨概率为 ”。这不是说一定会下雨 的时间,也不是说城市中 的地方一定下雨。更合理的理解是:在当前资料、模型和经验下,针对指定地点和指定时间段,预报员认为出现可测降水的可能性约为 。
这种概率带有判断成分。它依赖已有信息,也可能随着新信息改变。晚上看到雷达回波变强,概率可能上升;天气系统偏移,概率可能下降。

排队也很适合练概率语言。
在咖啡店排队时,你也许关心的不是“具体等几分几秒”,而是事件:
这个事件是否发生,取决于前面有多少人、每个人点单多久、是否突然来了很多外卖单、店员是否刚好换班。现实中的概率通常没有硬币那样整齐,但样本空间、事件和概率的语言仍然有用。
长期频率适合描述可以反复观察的随机机制,主观不确定性适合描述在已有信息下对单次情境的判断。两者都可以用概率表达,但它们回答问题的方式不同。
概率入门最常见的错误,往往不是公式太难,而是直觉太急。
“下雨”和“不下雨”是两个说法,但不表示各占 。如果某地正处在强台风影响下,下雨概率可能很高;如果是长期干旱季节,概率可能很低。
判断是否能平均分配概率,要看每个基本结果是否同样可能,而不是看语言上能分成几类。
很多人觉得连续 次正面“不像随机”。其实随机序列中出现短串、长串、局部偏多都很正常。真正不随机的,反而可能是过于整齐的序列。
你可以把随机想成“没有固定剧本”,而不是“每隔几步就自动平衡”。
的下雨概率不表示一定下雨, 的下雨概率也不表示一定不下雨。概率高说明更值得重视,不是保证书。
决策还要看后果。如果淋雨损失很大,即使下雨概率不高,也可能值得带伞;如果带伞非常麻烦,阈值又会变。
公平硬币的每次抛掷互不影响。连续几次正面之后,下一次仍然是正面或反面的机会各半。除非你开始怀疑硬币本身不公平,否则不能只凭“该轮到了”来改概率。
做下面题目时,先写样本空间或事件,再算概率。不要跳过“翻译”这一步。
抛两枚公平硬币。事件 是“正面和反面各出现一次”。写出事件 ,并求 。
事件 。样本空间有 四个同样可能的结果,所以:
掷一个公平六面骰。事件 是“点数大于 ”。写出事件 ,并求 。
样本空间是 。事件 ,包含 个结果,所以:
从普通扑克牌中随机抽一张。事件 是“抽到 A”。求 。
普通扑克牌有 张,其中 A 有 张。每张牌同样可能被抽到,所以:
天气预报说“明天下雨概率为 ”。下面哪种理解更合适?
更合适的是第 2 种。天气概率是对固定地点和固定时间段的不确定判断,不是把一天机械切成百分比,也不是把概率低于 的事件判成不可能。
一枚公平硬币已经连续 次出现正面。第 次出现反面的概率是多少?
如果硬币公平,并且每次抛掷互不影响,那么第 次出现反面的概率仍然是:
连续正面说明前面发生了一个少见序列,但它不会让公平硬币“欠”一个反面。
在咖啡店排队时,你关心“等待超过 分钟”。请用概率语言写出这个事件,并说明为什么它不一定容易用简单分数计算。
可以写成事件 。它不一定容易用简单分数计算,因为等待时间受顾客到达时间、点单复杂度、店员速度和临时状况影响。这里仍然可以用概率语言描述事件,但概率可能要靠历史数据、模拟或经验判断来估计。
这一节的重点不是背公式,而是建立表达顺序:
先确认随机实验是什么。你要观察的是抛硬币、抽卡、天气,还是一次排队等待?
再写出样本空间。所有可能结果是否列完整?是否需要区分顺序、位置或时间?
接着把日常语言翻译成事件。你关心的是“至少一个正面”“抽到红牌”“下雨”,还是“等待超过某个时间”?
最后再谈概率。如果基本结果同样可能,可以数结果;如果不是同样可能,就要依靠数据、模型或已有信息来估计。
下一次遇到不确定问题时,先别急着猜答案。先把可能结果摆出来,再把关心的事件圈出来。概率的计算,往往会在这两步之后变得自然得多。