这种解法错在哪里:生男生女概率各 50%,每个家庭都生到第一个男孩就不再生,那么产生的男女比例是多少?

为避免混淆,本回答采用有中国特色的背景,即每家只生一个男孩,而女孩数量服从几何分布。


先指出错误解法最明显的错误:所有家庭中男孩所占的比例,并不是各家男孩所占的比例的直接平均,而应该是按每家孩子总数加权后的平均。

用数学式子来说是下面这样。设共有 n 个家庭,第 i 个家庭有 1 个男孩和 X_i 个女孩,则:

所有家庭中男孩所占比例 = \frac{\sum_{i=1}^n 1}{\sum_{i=1}^n (X_i + 1)} \quad (1)

各家男孩所占比例的直接平均 = \frac{1}{n} \sum_{i=1}^n \frac{1}{X_i + 1} \quad (2)

各家男孩所占比例按每家孩子总数(即 X_i+1)加权后的平均 = \frac{\sum_{i=1}^n (X_i + 1) \cdot \frac{1}{X_i + 1}}{\sum_{i=1}^n (X_i + 1)} \quad (3)

容易看出 (1) 式和 (3) 式是相等的,但跟 (2) 式不是一回事。

若要求「全社会男孩所占比例的期望」,应该是对 (1) 式求期望之后再取 n \rightarrow \infty 的极限。

而错误解法没有加权,算的其实是 (2) 式的期望(这个期望与 n 无关,所以没有体现出「求极限」的步骤)。


再深入说几句:对 (1) 式求期望之后再求极限,就对了吗?其实也不对。

第一个问题:题目问的是「男女比例」,(1) 式擅自把它换成了「男孩占总体的比例」,合理吗?

我们来看,如果真的去算「男女比例的期望」,会发生什么。

我们可以把「n 个家庭总的男女比例」定义成一个随机变量 A_n = \frac{\sum_{i=1}^n 1}{\sum_{i=1}^n X_i}

注意了,有 2^{-n} 的概率,这 n 个家庭都没有女孩,此时 A_n = \infty

也就是说,对任意有限的 nA_n 都不存在!这是怎么回事呢?

原来,我们日常所说的「男女比例趋于 1」,并不是说 A_n 的期望趋于 1,而是说 A_n 作为一个随机变量,在 n \rightarrow \infty 时收敛于常数 1。

这就是第二个问题:题目里根本就没提到「期望」!

那么「A_n 作为一个随机变量收敛于 1」是什么意思呢?

随机变量的收敛有很多种,常见的包括依分布收敛依概率收敛几乎一定收敛

这三种收敛是越来越强的;对于收敛于常数的情形,前两者是等价的。

A_n \rightarrow 1 应该是哪一种收敛,我说不清楚…… 但既然 1 是常数,最弱也应该是依概率收敛。

依概率收敛的定义是: \forall \varepsilon, \lim_{n \rightarrow \infty} P(|A_n - 1| > \varepsilon) = 0 ,这才是应该去证的式子。

这时候我们再回来看第一个问题:「男女比例」能不能替换成「男孩占总体的比例」?

n 个家庭中男孩占总体的比例」,同样可以定义成一个随机变量 B_n = \frac{\sum_{i=1}^n 1}{\sum_{i=1}^n (X_i + 1)}

容易看出 B_n = \frac{A_n}{A_n + 1}

依概率收敛有个性质:若 X_n 依概率收敛于 Xf 是一个连续函数,则 f(X_n) 依概率收敛于 f(X)

A_nB_n 是通过一个连续函数联系在一起的,所以 A_n \rightarrow 1B_n \rightarrow 0.5 等价。

也就是说,在抛弃了「期望」之后,是可以把「男女比例趋于 1」替换成「男孩占总体的比例趋于 1/2」的。甚至还可以替换成「女男比例趋于 1」、「女孩占总体比例趋于 1/2」,这四个命题相互等价。

其中,「女男比例趋于 1」应该是最好证的,因为「n 个家庭总的女男比例」 的表达式为C_n = \frac{\sum_{i=1}^n X_i}{\sum_{i=1}^n 1} = \frac{1}{n} \sum_{i=1}^n X_i ,分母上没有 X_i ,形式最简单。



来源:知乎 www.zhihu.com
作者:王赟 Maigo

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。 点击下载

此问题还有 104 个回答,查看全部。

没有评论:

发表评论