自在学
分类课程智能体订阅
分类课程AI导师价格
课程进度
6 / 11
上一节相关不等于因果下一节计数、排列组合与概率计算
自在学

© 2025 - 2026 自在学,保留所有权利。

公网安备湘公网安备43020302000292号 | 湘ICP备2025148919号-1

关于我们隐私政策使用条款

© 2025 自在学,保留所有权利。

公网安备湘公网安备43020302000292号湘ICP备2025148919号-1

数学统计与概率入门概率从不确定开始

概率从不确定开始

桌面上同时摆着硬币、扑克牌、天气预报和排队号码,表现日常生活中的不确定情境
概率不是从公式开始的,而是从“结果还没发生,我该怎样说清楚”开始的。

明天会不会下雨?下一班车会不会马上来?这枚硬币会朝哪一面?从一副洗好的牌里抽出红牌还是黑牌?

这些问题都有一个共同点:答案还没有出现,但我们并不是完全无话可说。我们能列出可能结果,能说清楚自己关心哪一类结果,也能用一个数表示它有多可能发生。概率的第一步,就是把这种“不确定”说得足够清楚。

本节先建立概率语言,不急着进入复杂计算。你要先练会三句话:可能结果有哪些?我关心哪些结果?这些结果有多可能?


先问:结果还没发生时,我们到底知道什么

如果把一枚普通硬币抛到空中,落下前你不知道它会是正面还是反面。可是你通常知道,它不会变成骰子,不会出现“红桃 A”,也不会显示明天的天气。

这就是概率问题和完全混乱的区别。概率处理的是有边界的不确定:结果还不知道,但可能结果的范围可以先说清楚。

从四个日常场景看不确定

场景还不知道什么先能说清什么
抛一枚硬币正面还是反面可能只有正面、反面
从一副牌抽一张具体是哪张牌每一张牌都是一个可能结果
看天气预报明天这个地点是否下雨天气预报给出的是不确定判断
排队等咖啡自己要等几分钟等待时间会受前面人数和服务速度影响

注意,这里不是在说“世界很随机”。我们是在说:当结果还没发生,或者你还没观察到结果时,可以用概率语言来描述这种不确定。

概率语言的三件事

接下来反复使用三个词:

词直观说法例子
样本空间所有可能结果的集合抛一枚硬币:正面、反面
事件我们关心的一部分结果抛两枚硬币时,至少一个正面
概率事件发生可能性的度量“至少一个正面”的概率是多少

这些词听起来有点正式,但它们做的事很朴素:先把“可能发生什么”摆在桌面上,再圈出“我关心什么”。


样本空间:把可能结果说完整

一个矩形托盘中排列着硬币、卡牌和骰子结果小方块,表示样本空间中的所有可能结果
样本空间像一个托盘:一次实验可能出现的结果,都先放进来。

在概率里,“实验”不一定是实验室里的实验。只要你关心一个结果还没确定的过程,就可以把它看成一次随机实验。

随机实验的每一个具体结果叫做一个结果。所有可能结果合在一起,就是样本空间,常用 SSS 表示。

例子一:抛一枚硬币

如果只抛一枚硬币,而且只记录正面或反面,那么样本空间是:

S={正面,反面}S=\{\text{正面},\text{反面}\}S={正面,反面}

这看起来简单,但它已经做了一件重要的事:把问题的边界定下来了。

例子二:抛两枚硬币

如果抛两枚硬币,并且区分“第一枚”和“第二枚”,样本空间是:

S={正正,正反,反正,反反}S=\{\text{正正},\text{正反},\text{反正},\text{反反}\}S={正正,正反,反正,反反}

有同学会把“一个正面一个反面”只写成一种结果。这个写法适合回答“结果类型有几类”,但如果两枚硬币是分别抛出的,正反\text{正反}正反 和 反正\text{反正}反正 是两个不同结果。它们对应不同的发生路径。

写样本空间时,不要急着合并看起来相似的结果。先问清楚:题目是否区分顺序、位置、时间或身份?如果区分,它们就可能是不同结果。

交互:自己搭一个样本空间

例题:先列样本空间,再说事件

题目:先抛一枚硬币,再从只有一张红卡和一张黑卡的小盒中随机抽一张。请写出样本空间。

先确定这次随机实验有两个阶段:第一阶段是硬币,第二阶段是抽卡。每个最终结果都要同时包含这两个阶段的信息。

硬币有两个可能结果:正面、反面。抽卡也有两个可能结果:红卡、黑卡。每个硬币结果都可以和每个抽卡结果配成一个最终结果。

因此样本空间可以写成 S={正面且红卡,正面且黑卡,反面且红卡,反面且黑卡}S=\{\text{正面且红卡},\text{正面且黑卡},\text{反面且红卡},\text{反面且黑卡}\}S={正面且红卡,正面且黑卡,反面且红卡,反面且黑卡}。

最后检查是否漏掉或重复。这里一共有 2×2=42\times 2=42×2=4 个结果,每个结果都说明了硬币和卡片两个部分,所以样本空间完整。


事件:从结果里圈出关心的部分

样本空间矩形中有一部分结果被柔和颜色圈出,表示事件是样本空间中的子集
事件不是另一个世界,它就在样本空间里面,是被我们圈出来的一部分结果。

事件是样本空间中的一部分结果。它可以很小,也可以很大;可以只包含一个结果,也可以包含很多结果。

继续看抛两枚硬币:

S={正正,正反,反正,反反}S=\{\text{正正},\text{正反},\text{反正},\text{反反}\}S={正正,正反,反正,反反}

如果事件 AAA 表示“至少出现一个正面”,那么:

A={正正,正反,反正}A=\{\text{正正},\text{正反},\text{反正}\}A={正正,正反,反正}

如果事件 BBB 表示“两枚都是反面”,那么:

B={反反}B=\{\text{反反}\}B={反反}

事件的关键不是名字,而是它到底包含哪些结果。很多概率错误并不是算错了,而是事件一开始就圈错了。

事件可以来自日常语言

日常问题通常不会直接说“事件 AAA”。它会说:

日常说法概率语言
明天会下雨事件:明天指定地点出现可测降水
这张牌是红色事件:抽到红桃或方块
等咖啡超过 5 分钟事件:等待时间大于 5 分钟
至少有一个正面事件:结果中包含一个或两个正面

把日常语言翻译成事件,是概率学习里非常重要的一步。翻译越清楚,后面的计算越不容易偏。


概率:给事件一个可能性标尺

概率是一个从 000 到 111 的数,用来描述事件发生的可能性。000 表示不可能发生,111 表示一定发生,靠近 111 表示更可能发生,靠近 000 表示更不可能发生。

在所有基本结果同样可能时,可以用“数结果”的方法计算:

P(A)=事件 A 包含的结果数样本空间中的结果总数P(A)=\frac{\text{事件 }A\text{ 包含的结果数}}{\text{样本空间中的结果总数}}P(A)=样本空间中的结果总数事件 A 包含的结果数​

这条式子很有用,但它有一个前提:样本空间里的基本结果必须同样可能。普通六面骰的 1,2,3,4,5,61,2,3,4,5,61,2,3,4,5,6 通常被看成同样可能;一枚明显偏重的硬币,正反两面就不能直接这样处理。

不要把“列出了几个结果”误认为“每个结果都同样可能”。例如“今天下雨”和“今天不下雨”虽然可以写成两个结果,但并不自动各占一半。

例题:两枚硬币至少一个正面

题目:抛两枚公平硬币。事件 AAA 是“至少出现一个正面”。求 P(A)P(A)P(A)。

先列出样本空间。区分两枚硬币的位置或先后时,S={正正,正反,反正,反反}S=\{\text{正正},\text{正反},\text{反正},\text{反反}\}S={正正,正反,反正,反反},一共有 444 个同样可能的结果。

再圈出事件 AAA。至少一个正面包括 正正\text{正正}正正、正反\text{正反}正反、反正\text{反正}反正,不包括 反反\text{反反}反反。

事件 AAA 包含 333 个结果,样本空间包含 444 个结果,所以:

P(A)=34=0.75P(A)=\frac{3}{4}=0.75P(A)=43​=0.75

这个答案表示:如果重复很多次抛两枚公平硬币,出现“至少一个正面”的比例会在长期中接近 0.750.750.75。

例题:抽卡时不要漏掉样本空间

题目:从一副普通扑克牌中随机抽一张。事件 RRR 是“抽到红色牌”。求 P(R)P(R)P(R)。

普通扑克牌有 525252 张。如果不考虑大小王,红色牌包括红桃和方块,共 262626 张。

抽牌时每张牌被抽到的机会相同,所以可以用“有利结果数除以总结果数”的方法。

P(R)=2652=12P(R)=\frac{26}{52}=\frac{1}{2}P(R)=5226​=21​

这里的 12\frac{1}{2}21​ 来自牌的数量,而不是因为日常语言里只有“红色”和“黑色”两个词。


长期频率:短期会摇晃,长期有方向

白板上的硬币实验折线图显示正面累计比例从短期波动逐渐靠近 0.5
概率不保证每一小段都很均匀,它描述的是重复很多次后的长期倾向。

如果公平硬币正面的概率是 0.50.50.5,是不是每抛 101010 次就一定有 555 次正面?不是。

短期结果会摇晃。抛 101010 次出现 777 次正面并不奇怪,抛 202020 次出现连续几次正面也不奇怪。概率说的是长期趋势:当重复次数越来越多,正面出现的累计比例通常会越来越接近 0.50.50.5。

这就是长期频率的想法。概率可以被理解为大量重复试验中事件发生比例靠近的数。

交互:看硬币频率怎样靠近

长期不等于每一段都平均

把“长期接近”误读成“短期必须平均”,会带来很多错误判断。

例如,硬币已经连续出现了 444 次正面。下一次更可能是反面吗?

如果硬币公平,而且每次抛掷互不影响,那么下一次正面的概率仍然是:

P(下一次正面)=12P(\text{下一次正面})=\frac{1}{2}P(下一次正面)=21​

连续正面看起来“该反过来了”,但公平硬币没有记忆。过去的结果不会自动补偿未来的结果。

长期频率会靠近概率,不代表随机过程会主动修正短期偏差。看到一串正面后说“该出反面了”,通常是在把长期规律误用到单次预测上。


天气和排队:不是所有概率都来自反复实验

同一座城市上方排列多个天气预测面板,其中部分出现雨云,表现天气概率来自多个可能情境
天气概率通常描述固定地点和固定时间段里的不确定判断。

硬币和骰子适合用“重复很多次”的方式理解概率。可是有些问题不能真的重复同一个明天。

例如天气预报说“明天本地降雨概率为 30%30\%30%”。这不是说一定会下雨 30%30\%30% 的时间,也不是说城市中 30%30\%30% 的地方一定下雨。更合理的理解是:在当前资料、模型和经验下,针对指定地点和指定时间段,预报员认为出现可测降水的可能性约为 30%30\%30%。

这种概率带有判断成分。它依赖已有信息,也可能随着新信息改变。晚上看到雷达回波变强,概率可能上升;天气系统偏移,概率可能下降。

排队中的事件

咖啡店服务窗口前有人排队、有人看时间,旁边有小时间轴表示等待时间的不确定性
排队的不确定来自两件事:人什么时候来,以及每个人服务多久。

排队也很适合练概率语言。

在咖啡店排队时,你也许关心的不是“具体等几分几秒”,而是事件:

A={等待时间超过 5 分钟}A=\{\text{等待时间超过 }5\text{ 分钟}\}A={等待时间超过 5 分钟}

这个事件是否发生,取决于前面有多少人、每个人点单多久、是否突然来了很多外卖单、店员是否刚好换班。现实中的概率通常没有硬币那样整齐,但样本空间、事件和概率的语言仍然有用。

长期频率适合描述可以反复观察的随机机制,主观不确定性适合描述在已有信息下对单次情境的判断。两者都可以用概率表达,但它们回答问题的方式不同。


常见误区:概率没有那么会读心

概率入门最常见的错误,往往不是公式太难,而是直觉太急。

误区一:只要有两个结果,就是各占一半

“下雨”和“不下雨”是两个说法,但不表示各占 50%50\%50%。如果某地正处在强台风影响下,下雨概率可能很高;如果是长期干旱季节,概率可能很低。

判断是否能平均分配概率,要看每个基本结果是否同样可能,而不是看语言上能分成几类。

误区二:随机结果应该看起来很均匀

很多人觉得连续 555 次正面“不像随机”。其实随机序列中出现短串、长串、局部偏多都很正常。真正不随机的,反而可能是过于整齐的序列。

你可以把随机想成“没有固定剧本”,而不是“每隔几步就自动平衡”。

误区三:概率高就一定发生

80%80\%80% 的下雨概率不表示一定下雨,20%20\%20% 的下雨概率也不表示一定不下雨。概率高说明更值得重视,不是保证书。

决策还要看后果。如果淋雨损失很大,即使下雨概率不高,也可能值得带伞;如果带伞非常麻烦,阈值又会变。

误区四:先看到的结果会改变公平硬币下一次概率

公平硬币的每次抛掷互不影响。连续几次正面之后,下一次仍然是正面或反面的机会各半。除非你开始怀疑硬币本身不公平,否则不能只凭“该轮到了”来改概率。


练习:先说清楚,再计算

做下面题目时,先写样本空间或事件,再算概率。不要跳过“翻译”这一步。

练习一

抛两枚公平硬币。事件 AAA 是“正面和反面各出现一次”。写出事件 AAA,并求 P(A)P(A)P(A)。

事件 A={正反,反正}A=\{\text{正反},\text{反正}\}A={正反,反正}。样本空间有 {正正,正反,反正,反反}\{\text{正正},\text{正反},\text{反正},\text{反反}\}{正正,正反,反正,反反} 四个同样可能的结果,所以:

P(A)=24=12P(A)=\frac{2}{4}=\frac{1}{2}P(A)=42​=21​

练习二

掷一个公平六面骰。事件 BBB 是“点数大于 444”。写出事件 BBB,并求 P(B)P(B)P(B)。

样本空间是 S={1,2,3,4,5,6}S=\{1,2,3,4,5,6\}S={1,2,3,4,5,6}。事件 B={5,6}B=\{5,6\}B={5,6},包含 222 个结果,所以:

P(B)=26=13P(B)=\frac{2}{6}=\frac{1}{3}P(B)=62​=31​

练习三

从普通扑克牌中随机抽一张。事件 CCC 是“抽到 A”。求 P(C)P(C)P(C)。

普通扑克牌有 525252 张,其中 A 有 444 张。每张牌同样可能被抽到,所以:

P(C)=452=113P(C)=\frac{4}{52}=\frac{1}{13}P(C)=524​=131​

练习四

天气预报说“明天下雨概率为 30%30\%30%”。下面哪种理解更合适?

  1. 明天一定会下 30%30\%30% 的时间。
  2. 明天这个地点和时间段是否下雨还不确定,当前信息支持一个约 30%30\%30% 的下雨判断。
  3. 明天一定不会下雨,因为 30%30\%30% 小于 50%50\%50%。

更合适的是第 2 种。天气概率是对固定地点和固定时间段的不确定判断,不是把一天机械切成百分比,也不是把概率低于 50%50\%50% 的事件判成不可能。

练习五

一枚公平硬币已经连续 666 次出现正面。第 777 次出现反面的概率是多少?

如果硬币公平,并且每次抛掷互不影响,那么第 777 次出现反面的概率仍然是:

P(第 7 次反面)=12P(\text{第 }7\text{ 次反面})=\frac{1}{2}P(第 7 次反面)=21​

连续正面说明前面发生了一个少见序列,但它不会让公平硬币“欠”一个反面。

练习六

在咖啡店排队时,你关心“等待超过 888 分钟”。请用概率语言写出这个事件,并说明为什么它不一定容易用简单分数计算。

可以写成事件 D={等待时间超过 8 分钟}D=\{\text{等待时间超过 }8\text{ 分钟}\}D={等待时间超过 8 分钟}。它不一定容易用简单分数计算,因为等待时间受顾客到达时间、点单复杂度、店员速度和临时状况影响。这里仍然可以用概率语言描述事件,但概率可能要靠历史数据、模拟或经验判断来估计。


收束:概率先是一种表达方式

这一节的重点不是背公式,而是建立表达顺序:

先确认随机实验是什么。你要观察的是抛硬币、抽卡、天气,还是一次排队等待?

再写出样本空间。所有可能结果是否列完整?是否需要区分顺序、位置或时间?

接着把日常语言翻译成事件。你关心的是“至少一个正面”“抽到红牌”“下雨”,还是“等待超过某个时间”?

最后再谈概率。如果基本结果同样可能,可以数结果;如果不是同样可能,就要依靠数据、模型或已有信息来估计。

下一次遇到不确定问题时,先别急着猜答案。先把可能结果摆出来,再把关心的事件圈出来。概率的计算,往往会在这两步之后变得自然得多。

  • 先问:结果还没发生时,我们到底知道什么
    • 从四个日常场景看不确定
    • 概率语言的三件事
  • 样本空间:把可能结果说完整
    • 例子一:抛一枚硬币
    • 例子二:抛两枚硬币
    • 交互:自己搭一个样本空间
    • 例题:先列样本空间,再说事件
  • 事件:从结果里圈出关心的部分
    • 事件可以来自日常语言
  • 概率:给事件一个可能性标尺
    • 例题:两枚硬币至少一个正面
    • 例题:抽卡时不要漏掉样本空间
  • 长期频率:短期会摇晃,长期有方向
    • 交互:看硬币频率怎样靠近
    • 长期不等于每一段都平均
  • 天气和排队:不是所有概率都来自反复实验
    • 排队中的事件
  • 常见误区:概率没有那么会读心
    • 误区一:只要有两个结果,就是各占一半
    • 误区二:随机结果应该看起来很均匀
    • 误区三:概率高就一定发生
    • 误区四:先看到的结果会改变公平硬币下一次概率
  • 练习:先说清楚,再计算
    • 练习一
    • 练习二
    • 练习三
    • 练习四
    • 练习五
    • 练习六
  • 收束:概率先是一种表达方式

目录

  • 先问:结果还没发生时,我们到底知道什么
    • 从四个日常场景看不确定
    • 概率语言的三件事
  • 样本空间:把可能结果说完整
    • 例子一:抛一枚硬币
    • 例子二:抛两枚硬币
    • 交互:自己搭一个样本空间
    • 例题:先列样本空间,再说事件
  • 事件:从结果里圈出关心的部分
    • 事件可以来自日常语言
  • 概率:给事件一个可能性标尺
    • 例题:两枚硬币至少一个正面
    • 例题:抽卡时不要漏掉样本空间
  • 长期频率:短期会摇晃,长期有方向
    • 交互:看硬币频率怎样靠近
    • 长期不等于每一段都平均
  • 天气和排队:不是所有概率都来自反复实验
    • 排队中的事件
  • 常见误区:概率没有那么会读心
    • 误区一:只要有两个结果,就是各占一半
    • 误区二:随机结果应该看起来很均匀
    • 误区三:概率高就一定发生
    • 误区四:先看到的结果会改变公平硬币下一次概率
  • 练习:先说清楚,再计算
    • 练习一
    • 练习二
    • 练习三
    • 练习四
    • 练习五
    • 练习六
  • 收束:概率先是一种表达方式