用概率判生死:法庭上的数学证据

from 果壳网 guokr.com – 果壳网 http://www.guokr.com/article/99261/

如果你哪天不留神做错了一道概率题会有什么不堪设想的严重后果?自然是没有的。我想最多也就是考试挂科,补考重修而已。可是对于法庭上那帮戴着假发的人来说,概率没算好可以让无辜的人进监狱,让真正的罪犯逍遥法外。听起来似乎不可思议,但这样的事情真的发生过。

洛杉矶抢劫案

历史上最著名的案例要数 1964 年夏天发生在美国洛杉矶的一起劫案。一天中午,一位老妇人从杂货店买了东西推着小车回家,途经一条小巷时,突然被一位冲过来的年轻女子推倒,等老妇人醒过神来,发现自己身上的钱包已被偷走,女贼也早跑了很远。虽然老妇人没有看清罪犯是什么样子,可小巷周围的不少住户都曾与这位女子擦肩而过,并且看到她在街头跳上一辆车逃离现场。

后来警方根据目击者描述的犯罪者特征,几天后在附近逮捕了一对夫妻(Malcolm Collins 和 Janet Collins. Malcolm)。可是在法庭上,目击者中并没有人能够清晰地指认出罪犯,因此检方很难将 2 人定罪。于是检察官们想出了一个“新颖的办法”,他们把目击证人说出的几条主要特征列了出来,并且根据洛杉矶地区的数据估算了这些特征会出现的概率:

黄色的汽车:1/10

嘴上面有短胡子的男性:1/4

络腮胡子的黑人:1/10

马尾辫女孩:1/10

金发女孩:1/3

汽车中有肤色不同的夫妻俩:1/1000

检察官找来一位“数学专业人士”,计算了在整个洛杉矶地区符合上述各条特征的夫妇存在的概率,这位“数学专业人士”认为最后的概率应该是 6 个概率值乘到一起,结果就是 1/1200万。检察官据此告知评审团,如此小的概率很难发生,附近地区很难再找到另外一对 6 项特征全部符合的夫妇,所以这对嫌疑人一定是罪犯。陪审团最终采纳了检方的意见,判定这对夫妇抢劫罪成立。

可是后来加州高等法院驳回了这个判决,他们认为检方使用的概率作为证据的方式是错误的。

首先,概率乘法公式 P(ABC) = P(A)P(B)P(C) 一定要在 A,B,C 都是独立事件的时候才成立,可是目击者提供的那些特征并不相互独立,比如留八字胡的男性和留络腮胡的男性这两项,“男性”这个信息是重叠的,而喜欢留胡子的人往往两个位置都会留胡子,两个特征高度关联,同时发生的概率远远大于两个数字相乘。马尾辫女孩和短发女孩也是同样的道理。这样的话,正确的概率可能会是 1/1200万的很多倍,并没有那么低。

退一步说,假定概率真的是 1/1200万,以案发附近地区有 400 万人算,至少有2位夫妇符合目击者全部特征的概率是 1 – (11999999/12000000) 4000000 ,超过 30%,也就是说,仅仅根据 1/1200万 的概率断就判定这对夫妇是唯一的也没有道理。

母亲杀子案

https://i0.wp.com/img1.guokr.com/gkimage/xe/p2/p4/xep2p4.png

类似的用数学计算来判案还不止一次。 1999 年,英国也有一次“概率定罪”的案件。一个Sally Clark的妇女第一个孩子出生之后几个星期离奇死亡,医生查不出其他病因,只诊断为一种叫 SIDS (婴儿猝死综合症)的罕见疾病。随后Clark再次怀孕,第 2 个孩子也在出生后几个星期死亡,原因再次被诊断为SIDS。这件事引起了警方的怀疑,警方认为 2 个孩子有可能是“被猝死”的,将 Clark 逮捕。

在法庭上,检方引用医生的证明,声称 SIDS 这种病发病率很低,而且不是遗传病,所以可以把两个孩子的 SIDS 死亡看作独立事件,相乘之后的概率只有 1/7300万。和洛杉矶劫案类似,概率在这里再次被当做一个关键证据。检方以此说服了陪审团,法庭最后认为两个孩子连续得这种突发罕见疾病的概率很低,很难发生,Clark 杀死孩子罪行应该成立,被送入监狱。

和上一个故事的结局一样,这个判决后来也被推翻了, Clark 被无罪释放。

不妨让我们来看看检方的观点。他们认为 P(两个孩子都死于SIDS) = 1/73000000,那么 P(Clark杀了两个孩子) = 1 – 1/73000000 = 72999999/73000000,几乎是铁定的事实。

但是,检方疏忽了一个非常关键的事实,那就是上面这个推理只有在 P(两个孩子都死于SIDS) + P(Clark杀了孩子) = 1 时才成立。事实上,除了这两种情况外还有其他可能,检方并不能完全排除。

英国皇家统计学会后来指出,真要计算的话,一位母亲连续杀死自己两个亲骨肉这样极其变态行为发生的可能性同样是极低的,甚至低于两个孩子都死于 SIDS 病的可能性。在判断概率的时候,不能只看P(两个孩子都死于SIDS)有多小,还要看和P(母亲连续杀死两个孩子)做相对比较。最后上诉的一方凭借更加全面的解释和一些新证据(比如第二个孩子可能受过细菌感染,有可能既不是死于 SIDS,也不是被杀)成功地为 Clark 洗脱罪名。

辛普森案

辛普森在法庭上演示将手伸进手套(证物)时,非常费力和勉强。图片来源:tbo.com

辛普森在法庭上演示将手伸进手套(证物)时,非常费力和勉强。图片来源:tbo.com

第三个案件是美国的 1994 年到 1995 年的Simpson辛普森案件,辛普森是当年著名的橄榄球明星,因为涉嫌杀害自己的妻子被起诉,引起轩然大波,当时估计全美有1亿人看了对这个案件的电视转播。腰缠万贯的辛普森花高价聘请“梦幻组合律师团”为自己辩护,其中包括哈佛大学法学院的教授Alan Dershowitz,作为一位百战百胜的律师,Alan在这个案件中作为辩方一员再次大展身手。

本来警方在案件现场收集到了很多证据,包括带血的手套、血迹、现场DNA检验。为了证实辛普森是有意图杀害自己妻子的,警方还特意收集了大量辛普森长期殴打虐待妻子的证据。似乎辛普森难逃被定罪伏法的命运,可是辩护律师们通过各种方法一一化解掉了检方的所有证据,护律师团还宣称洛杉矶警察局有其他失职行为。在经历了长达9个月的审判后,辛普森被宣判无罪。

在 9 个月的马拉松式审判中,有一个用数学来辩护的小插曲。就是在对于虐待妻子这一条上,大律师Alan用概率的方法在法庭上辩解,“美国每年有 400 万妇女被丈夫或男友殴打,可是美国每年只有 1432 名妇女被丈夫杀死,这样说明那些长期虐待妻子的男人最后出手杀人的概率也就 1/2500,检方的说法不靠谱”。Alan的辩词似乎听起来挺有道理,检察官一时“反应不过来”,提不出好的理由进行反驳。

可是从概率的角度上看,Alan的辩词只是狡辩而已。我们定义事件 A 是一个美国人虐待了妻子, B 是一个美国人杀了妻子。在事先没有任何给定信息的前提下,Alan律师估计的条件概率是 P(B|A) = 1/2500。

但现实是,事件 A 已经发生,辛普森确实虐待了妻子,概率为1。他的妻子被杀的事情也已经发生,只是不清楚是谁是凶手。P(B|A)中 A、B 真正的定义应该是:

A:一个人虐待了妻子并且妻子被杀

B:凶手正是这个人

根据资料,P(B|A)可以达到 90% 之高,也就是说在所有遭到谋杀的被虐美国妻子中,90%是被施虐者杀害。不过在庭审的时候,检方并没有能及时提出这个论点,不幸让Alan律师的诡辩得逞。


参考资料:

[1] The Numbers Behind Numbers, Solving Crime with Mathematics, Keith Devlin, Gary Lorden

[2] The Drunkard’s Walk: How Randomness Rules Our Lives, Leonard Mlodinow

Advertisements

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s