二孩悖论——两个孩子其中一个是男孩,另一个也是男孩的概率是多少?

一个人有两个孩子,已知其中一个是男孩,另外一个也是男孩的概率是多少呢?当我们聊到概率问题的时候,我就预感到不妙了,这个争论了半个多世纪的二孩问题依旧还是那么吸引人,那我们今天就再来讨论一波二孩悖论。

问题就是刚才说的,两个孩子,其中一个是男孩,另外一个也是男孩的概率是多少呢?或者问两个孩子都是男孩的概率是多少呢?大部分人的第一反应应该是,男孩女孩各50%概率嘛,按照无差别原则也应该是这样的,等概,所以是二分之一。但如果我们把所有的可能性都列举出来就会发现,好像还没那么简单。两个孩子的性别组合可以有四种情况,男男、男女、女男、女女。其中一个是男孩,有三种情况,在这三种情况中,另外一个也是男孩的情况只有男男这一种,所以概率显然是1/3,而不是1/2。

于是好多人说这是一个语文题,而不是数学题,因为造成结果不一样的原因是题干描述的不过准确清晰,“其中,一个是男孩”,和“其中一个,是男孩”这两种表述的含义是不同的,确实我同意这个观点,其中有一个是男孩,指的是至少有一个是男孩,它对应的问题的答案应该是1/3,而其中特指的一个是男孩,为了让含义更加清晰,我们可以说其中哥哥是男孩,这种情况就缩小了要求的样本空间的子集,所以答案是1/2。没问题。但如果二孩悖论要是这么简单就不会争论半个世纪了。因为它产生太多变体了。好,那我们继续。

还是这个问题,请听题,说一个人有两个孩子,至少有一个是男孩,这回我们规范一下表达是吧,至少有一个是男孩,且这个男孩是个双眼皮。请问,另外一个孩子也是男孩的概率是多少呢?你可能会觉得很无厘头,双眼皮和性别有什么关系呢?别着急慢慢来,当然我们这里考虑单眼皮和双眼皮的概率是均等的,不要考虑遗传染色体啥的。先来说答案,这个问题的答案不是二分之一,也不是三分之一,是七分之三。如果不使用条件概率公式,我们也可以这样考虑这个问题,它相当于是两个样本空间的叠加,即性别和单双眼皮的组合。那我们还是全部列举出来,看这个图,每一列的表头是性别的四种情况,男男、男女、女男、女女四种情况,下面分别对应了每种性别情况下的单双眼皮情况,单双眼皮的组合一共有几种情况啊?单单、单双、双单、双双也是四种,所以再考虑上性别整体所有的情况就是4x4=16种情况。然后我们来找符合题意的情况,至少一个是双眼皮男孩,然后发现符合的一共有7种,其中两个孩子都是男孩的情况有三种,所以概率是七分之三。这个问题可能有点反直觉了。但大家先不要考虑为什么会这样,我们再来看一个类似的问题。

举一反三,说一个人有两个孩子,其中至少有一个是男孩,这和刚才是一样的。且这个男孩出生在星期二,请问两个孩子都是男孩的概率是多少呢?这回你不会觉得无厘头了,因为和刚才一样,只是又给了一个样本空间,我们依旧把它们结合起来就好了,表头还是四种性别组合,每列分别是出生星期组合,一周七天,两个孩子一共有多少种情况啊?7^2=49种情况,所以总共就是49x4=196种情况,然后我们再找其中符合题意的有27种情况,再然后里面两个孩子都是男孩的情况共有13种,所以这道题的概率是13/27,这个思路明确了吗?实际上就是两个样本空间的叠加,性别两个选项和星期7个选项的叠加,我们甚至还可以和一个月30天的叠加,比如说,两个孩子,其中至少有一个男孩,且出生在1号,问两个孩子都是男孩的概率。这个问题按照刚才的思路也是可求的。都行。以此类推,我们甚至还可以很轻松的总结出公式,如果和n个选项的情况叠加,然后至少一个是男孩,且这个男孩符合n种情况的一个,那么两个孩子都是男孩的概率就是(2n-1)/(4n-1),比如说刚才的3/7就是n=2的情况,13/27就是n=7的情况。各位感兴趣可以自行验算一下。到这里产生了两个问题,第一个,如果只给出了“至少有一个是男孩”,那么另外一个也是男孩的概率是三分之一,但是当我们叠加了其他信息之后,这个概率似乎是在变大,比如刚才的两个问题的答案,13/27>3/7>1/3,13/27约等于0.48,已经很接近1/2了。我们通过(2n-1)/(4n-1)的公式也不难发现,当n趋于无穷大的时候,概率其实就是1/2。所以我们只要在二孩问题的基础上,再叠加一个具有无限种情况的样本空间,那么答案就会变成1/2,比如说两个孩子,至少有一个是男孩,且这个男孩喜欢数字1,求另外一个也是男孩的概率。喜欢数字1,自然数显然有无限多个吧?那么这个看似无用的信息就可以把答案从1/3变成1/2?如果这个版本的描述让你觉得不是很好接受,那我们换一个,已知一个家庭有两个孩子,其中至少有一个叫小强的男孩,请问另外一个也是男孩的概率是多少呢?名字的组合显然有很多种吧,所以答案是十分接近1/2,而不是1/3。第二个问题,可能就是大家不理解的,为什么我给出了一些看似无用的信息,却可以影响结果呢?这就又要说到对于概率的理解了。

关于什么是概率这个问题,人们一直存在不同的看法,主要可以分为偏客观的频率学派和偏主观的贝叶斯学派。

频率学派顾名思义,认为概率是多次重复试验中相对频率的极值,它遵循自然规律。比如说我们抛硬币,如果我们统计出现正面的概率,在最初的几次频率可能是忽高忽低,但是随着实验次数的增多频率会趋于稳定在0.5左右,所以我们说下一次出现正面的概率是1/2。注意是下一次出现正面的概率,它代表着一种预测。但如果我已经抛完一枚硬币了,在我手里呢,现在我让你猜,这枚硬币是正面的概率是多少呢?在频率学派看来,这个问题没有太大意义。因为抛硬币的结果早在落地的那一刻就已经决定好了,所以你硬要问我概率,那要么是0要么是1,这就是频率学派对于概率的认识。

而贝叶斯学派则认为,概率是人们根据经验数据总结修正出来的个人信念,划重点这是一种主观行为。这里说的经验数据在贝叶斯概率里叫做先验概率,先验概率可以是确定的,也可以是估计的,不确定的,都没关系,然后我们再根据贝叶斯公式来计算一个后验概率,这个过程是可以重复修正的,也就是说我们可以把计算的后验概率再当做先验概率来进行修正。这件事儿也是频率学派无法接受的,概率应该是确定的,怎么能估计一个概率然后再慢慢修正呢?当然,两个学派之间没有对错之分,只是对于世界的认识方式,使用的局限性不同而已。频率学派和贝叶斯学派的观点就有点像量子力学中对于波函数的诠释。但是这些不重要,因为在实际当中,两种统计方法往往会给出相同的答案。所以这里我们也不做过多解读了。

说回到上面问题,二孩问题显然是条件概率问题,属于贝叶斯学派讨论的范畴,如果按照频率学派的观点,这个问题就没有意义了,孩子是男是女,因为孩子已经出生了,所以概率要么是0,要么是1,这应该是一件很确定的事儿。因此,如果你得答案是无论原题如何表述,给多少信息答案都应该是1/2,那其实你不属于任何学派,因为结果不对。而在贝叶斯学派看来,因为这个概率是主观的,是根据我们已知的信息来进行不断修正的,所以答案会产生变化也不足为奇。因此这可能是大多数人不太理解的原因之一。说白了就是如果你按照条件概率的公式来计算,结果就是不一样的。也就是说给到的信息确实是会影响到结果的概率。

另外还有一点是值得大家关注的,就是当n趋于无穷大概率就变成1/2这件事儿,我们是不是也可以这样理解,当我们获得一个信息的时候,概率随之增大,代表着什么呢?首先代表着概率空间的变化,因此信息是用来修剪概率空间手段。其次还代表着确定性的变化。而当我们获得了“哥哥是个男孩”、“男孩的名字叫做小强”这样的信息之后,另外一个孩子是男孩的概率从1/3变成了1/2,相比于“出生在星期二”这样的信息,那是不是意味着更加确定的信息可以影响更大的不确定性呢?在信息论中信息所包含的平均信息量也叫做信息熵。而信息熵也正是随机事件不确定性的度量。所以那些看似无用的信息,也许并非真正无用,因为它往往可以影响我们对于一件事情的判断,改变我们对于事件的确定性。这也正是贝叶斯概率的精髓所在。至此,对于二孩问题清楚了吗?

好,本期的视频就到这,我是妈咪叔,一个较真儿的理工男,咱们下期见,拜拜。

标签:

最新资讯

文档百科

CopyRight © 2000~2023 一和一学习网 Inc.All Rights Reserved.
一和一学习网:让父母和孩子一起爱上学习