首页 >> 数学 >> 文章

如果你哪天不留神做错了一道概率题会有什么不堪设想的严重后果?自然是没有的。我想最多也就是考试挂科,补考重修而已。可是对于法庭上那帮戴着假发的人来说,概率没算好可以让无辜的人进监狱,让真正的罪犯逍遥法外。听起来似乎不可思议,但这样的事情真的发生过。

洛杉矶抢劫案

历史上最著名的案例要数 1964 年夏天发生在美国洛杉矶的一起劫案。一天中午,一位老妇人从杂货店买了东西推着小车回家,途经一条小巷时,突然被一位冲过来的年轻女子推倒,等老妇人醒过神来,发现自己身上的钱包已被偷走,女贼也早跑了很远。虽然老妇人没有看清罪犯是什么样子,可小巷周围的不少住户都曾与这位女子擦肩而过,并且看到她在街头跳上一辆车逃离现场。

后来警方根据目击者描述的犯罪者特征,几天后在附近逮捕了一对夫妻(Malcolm Collins 和 Janet Collins. Malcolm)。可是在法庭上,目击者中并没有人能够清晰地指认出罪犯,因此检方很难将 2 人定罪。于是检察官们想出了一个“新颖的办法”,他们把目击证人说出的几条主要特征列了出来,并且根据洛杉矶地区的数据估算了这些特征会出现的概率:

  • 黄色的汽车:1/10
  • 嘴上面有短胡子的男性:1/4
  • 络腮胡子的黑人:1/10
  • 马尾辫女孩:1/10
  • 金发女孩:1/3
  • 汽车中有肤色不同的夫妻俩:1/1000

检察官找来一位“数学专业人士”,计算了在整个洛杉矶地区符合上述各条特征的夫妇存在的概率,这位“数学专业人士”认为最后的概率应该是 6 个概率值乘到一起,结果就是 1/1200万。检察官据此告知评审团,如此小的概率很难发生,附近地区很难再找到另外一对 6 项特征全部符合的夫妇,所以这对嫌疑人一定是罪犯。陪审团最终采纳了检方的意见,判定这对夫妇抢劫罪成立。

可是后来加州高等法院驳回了这个判决,他们认为检方使用的概率作为证据的方式是错误的。

首先,概率乘法公式 P(ABC) = P(A)P(B)P(C) 一定要在 A,B,C 都是独立事件的时候才成立,可是目击者提供的那些特征并不相互独立,比如留八字胡的男性和留络腮胡的男性这两项,“男性”这个信息是重叠的,而喜欢留胡子的人往往两个位置都会留胡子,两个特征高度关联,同时发生的概率远远大于两个数字相乘。马尾辫女孩和短发女孩也是同样的道理。这样的话,正确的概率可能会是 1/1200万的很多倍,并没有那么低。

退一步说,假定概率真的是 1/1200万,以案发附近地区有 400 万人算,至少有2对夫妇符合目击者全部特征的概率是 1 - (11999999/12000000) 4000000 ,超过 30%,也就是说,仅仅根据 1/1200万 的概率断就判定这对夫妇是唯一的也没有道理。

母亲杀子案

类似的用数学计算来判案还不止一次。 1999 年,英国也有一次“概率定罪”的案件。一个Sally Clark的妇女第一个孩子出生之后几个星期离奇死亡,医生查不出其他病因,只诊断为一种叫 SIDS (婴儿猝死综合症)的罕见疾病。随后Clark再次怀孕,第 2 个孩子也在出生后几个星期死亡,原因再次被诊断为SIDS。这件事引起了警方的怀疑,警方认为 2 个孩子有可能是“被猝死”的,将 Clark 逮捕。

在法庭上,检方引用医生的证明,声称 SIDS 这种病发病率很低,而且不是遗传病,所以可以把两个孩子的 SIDS 死亡看作独立事件,相乘之后的概率只有 1/7300万。和洛杉矶劫案类似,概率在这里再次被当做一个关键证据。检方以此说服了陪审团,法庭最后认为两个孩子连续得这种突发罕见疾病的概率很低,很难发生,Clark 杀死孩子罪行应该成立,被送入监狱。

和上一个故事的结局一样,这个判决后来也被推翻了, Clark 被无罪释放。

不妨让我们来看看检方的观点。他们认为 P(两个孩子都死于SIDS) = 1/73000000,那么 P(Clark杀了两个孩子) = 1 - 1/73000000 = 72999999/73000000,几乎是铁定的事实。

但是,检方疏忽了一个非常关键的事实,那就是上面这个推理只有在 P(两个孩子都死于SIDS) + P(Clark杀了孩子) = 1 时才成立。事实上,除了这两种情况外还有其他可能,检方并不能完全排除。

英国皇家统计学会后来指出,真要计算的话,一位母亲连续杀死自己两个亲骨肉这样极其变态行为发生的可能性同样是极低的,甚至低于两个孩子都死于 SIDS 病的可能性。在判断概率的时候,不能只看P(两个孩子都死于SIDS)有多小,还要看和P(母亲连续杀死两个孩子)做相对比较。最后上诉的一方凭借更加全面的解释和一些新证据(比如第二个孩子可能受过细菌感染,有可能既不是死于 SIDS,也不是被杀)成功地为 Clark 洗脱罪名。

辛普森案

【辛普森在法庭上演示将手伸进手套(证物)时,非常费力和勉强。图片来源:tbo.com】

第三个案件是美国的 1994 年到 1995 年的Simpson辛普森案件,辛普森是当年著名的橄榄球明星,因为涉嫌杀害自己的妻子被起诉,引起轩然大波,当时估计全美有1亿人看了对这个案件的电视转播。腰缠万贯的辛普森花高价聘请“梦幻组合律师团”为自己辩护,其中包括哈佛大学法学院的教授Alan Dershowitz,作为一位百战百胜的律师,Alan在这个案件中作为辩方一员再次大展身手。

本来警方在案件现场收集到了很多证据,包括带血的手套、血迹、现场DNA检验。为了证实辛普森是有意图杀害自己妻子的,警方还特意收集了大量辛普森长期殴打虐待妻子的证据。似乎辛普森难逃被定罪伏法的命运,可是辩护律师们通过各种方法一一化解掉了检方的所有证据,护律师团还宣称洛杉矶警察局有其他失职行为。在经历了长达9个月的审判后,辛普森被宣判无罪。

在 9 个月的马拉松式审判中,有一个用数学来辩护的小插曲。就是在对于虐待妻子这一条上,大律师Alan用概率的方法在法庭上辩解,“美国每年有 400 万妇女被丈夫或男友殴打,可是美国每年只有 1432 名妇女被丈夫杀死,这样说明那些长期虐待妻子的男人最后出手杀人的概率也就 1/2500,检方的说法不靠谱”。Alan的辩词似乎听起来挺有道理,检察官一时“反应不过来”,提不出好的理由进行反驳。

可是从概率的角度上看,Alan的辩词只是狡辩而已。我们定义事件 A 是一个美国人虐待了妻子, B 是一个美国人杀了妻子。在事先没有任何给定信息的前提下,Alan律师估计的条件概率是 P(B|A) = 1/2500。

但现实是,事件 A 已经发生,辛普森确实虐待了妻子,概率为1。他的妻子被杀的事情也已经发生,只是不清楚是谁是凶手。P(B|A)中 A、B 真正的定义应该是:

A:一个人虐待了妻子并且妻子被杀

B:凶手正是这个人

根据资料,P(B|A)可以达到 90% 之高,也就是说在所有遭到谋杀的被虐美国妻子中,90%是被施虐者杀害。不过在庭审的时候,检方并没有能及时提出这个论点,不幸让Alan律师的诡辩得逞。

参考资料

[1] The Numbers Behind Numbers, Solving Crime with Mathematics, Keith Devlin, Gary Lorden

[2] The Drunkard's Walk: How Randomness Rules Our Lives, Leonard Mlodinow

关于本文

本文首发于果壳网(guokr.com)“死理性派”主题站《用概率判生死:法庭上的数学证据

0
相关文章

35 Responses to “用概率判生死:法庭上的数学证据”

  1. yibo说道:

    后来警方根据目击者描述的犯罪者特征,几天后在附近逮捕了一对夫妻(Malcolm Collins 和 Janet Collins. Malcolm)。

    看到这对夫妻的名字觉得太奇怪,网上搜了一下,应该是 妻 Janet Louise Collins 夫 Malcolm Ricardo Collins。

  2. wxf说道:

    当谈论概率的时候,一切都是可能性,不是必然性。西方法律要求的是:宁可放过三千,也不冤枉一个。在这种指导思想下,法庭要的是确定的事实,不是可能性。因此,如果概率计算对被告有利,这个证据可以起作用。但如果概率证据对被告不利就不同了。

    另外,概率证据在法庭上非常容易被驳回:计算概率所用的模型和数据很难被证明是完全正确的,例如独立性、数据的重复性验证(如某特征在某地区某时间段的出现概率)都很难进行。实际上,疑难案件几乎都不具有可重复性。当你根据概率模型预言某个人是凶手的概率为90%时,这个预言(90这个数据)根本不可能被证伪。

    • jjx01说道:

      >可是在法庭上,目击者中并没有人能够清晰地指认出罪犯

      如果没有可靠的证据,这样就可以直接宣布无罪了...
      人类对一件事情的记忆是很不可靠的,很容易被操纵,"在美國,證人錯誤指認是最常造成冤獄的原因,因為DNA檢驗而能洗刷罪名的囚犯中,75%的人遭到錯誤指認"
      http://wired.tw/2012/08/20/eyewitness-memory/index.html

      做这种实验太简单了,放段录像,隔一两周叫看录像的人回忆细节.

  3. 枫林之声说道:

    退一步说,假定概率真的是 1/1200万,以案发附近地区有 400 万人算,至少有2对夫妇符合目击者全部特征的概率是 1 - (11999999/12000000)^ 4000000,超过 30%
    -----------------------------------------------------------------------------------------
    好像不对吧,这是原资料里面的结果吗?这是二项分布,用Poisson分布近似的结果应该是1-exp(-1/3)-1/3*exp(-1/3)≈4.5%

    • blablasky说道:

      我觉得这个例子用不到分布,文中那个算法已经是做过假设的,假设它们全是独立事件,这些事件在人群中发生的概率是随机的,且P=1/1200万,那此事件完全不发生的概率就是P(x=0)=(1-1/1200万)^400万,至少发生一次的概率就是1-P(x=0),差不多是28%。如果要问至少发生两次的概率,应该是1-P(x=0)-P(x=1), 这个数字应该更小一点,但不管怎么说,都没小到不可能发生的地步。

      • 枫林之声说道:

        按你这么算,结果还是4.5%
        P(x=0)=(1-1/12000000)^4000000=0.7165
        P(x=1)=4000000*(1/12000000)*(11999999/12000000)^3999999=0.2388

        1-0.7165-0.2388≈4.5%

        作者(或者是原始资料的作者)估计是忘记减P(x=1)了。

        • blablasky说道:

          确实,文中这段的表述不准确,要么改成“至少有一对夫妇符合的概率”,要么就把P(x=1)也放进去。而且其实你之前用泊松分布来做也是更简便,泊松分布是二项分布的大数模拟,虽然x=0或1的情况可以用二项分布求精确解,但x取值一多就变困难了……

    • 莫雨Alexis说道:

      同意同意~文章算的是至少有一对夫妇符合特征的概率~

  4. 张宁同学说道:

    用概率定罪很不靠谱

  5. magicman说道:

    洛杉矶抢劫案等同于方舟子质疑韩寒有代笔

    • jjx01说道:

      洛杉矶抢劫案里证人的发言很不靠谱,可以说那些信誓旦旦作证韩寒临场创作杯中窥人的证人对当年的情况早就没有了印象

  6. 拼音佳佳说道:

    我怎么觉得这些都是"用概率脱罪"的案例???

  7. blablasky说道:

    这几个案列中涉及到的概率知识都简单到令人发指,全是大学非数理专业本科入门水平,还是美国大学,中国的话我估计很多地区高中就讲过了(我就记得我高中学过简单的概率论),其中也就贝叶斯条件概率还算有点绕,第一和第二个案例都错得用常识判断都能感觉到不对。 第三个案例,我倒是挺感兴趣想自己算算,可惜信息不足,而且其实是好几个条件概率套在一起,这个检方一时算不出来是正常的,但没意识到对方使用的算法不对是典型的数学不过关,但凡学过一点点统计都不至于,所有统计课都是讲完排列组合之后马上就讲独立事件和条件概率的……难道美国法学生完全不学概率么……

    • seaeye说道:

      学过跟会用是两码事。
      法庭上被人质问就更加难以立即反应过来。

  8. @eLibrary说道:

    【松鼠会 Albert_JIAO 文章】用概率判生死:法庭上的数学证据http://songshuhui.net/archives/78532 所引用的书籍 The Drunkard's Walk: How Randomness Rules Our Lives By Leonard Mlodinow【新浪微博@eLibrary提供直链pdf】http://zl.hwpan.com/u36594600/%E6%95%B0%E5%AD%A6/Leonard%20Mlodinow-The%20Drunkard's%20Walk_%20How%20Randomness%20Rules%20Our%20Lives%20(2008).pdf
    所引用的书籍The Numbers Behind Numbers, Solving Crime with Mathematics By Keith Devlin, Gary Lorden【新浪微博@eLibrary提供pdf直链】http://zl.hwpan.com/u36594600/%E6%95%B0%E5%AD%A6/Keith%20Devlin,%20Gary%20Lorden-The%20Numbers%20Behind%20NUMB3RS_%20Solving%20Crime%20with%20Mathematics-Plume%20(2007).pdf

  9. bridged说道:

    这篇写得太浅。建议参考《阴谋论得以奏效的数学基础》
    http://blog.sina.com.cn/s/blog_6988131f0100zd4h.html

  10. ZKL说道:

    统计学中假设检验认为一次随机样本小概率事件不应发生。美国刑法判决本质是宁可放走一个疑犯,不能错判一个好人,但民事诉讼中不用这法则。辛普森案例警方在取证上失误,放走了辛普森,但民事法庭,其赔了几千万美圆。
    法律在判决难时,陪审团优点显示出来。因如贿赂十几名陪审员难度比“极大多数”法官大多了。

    • cyler123说道:

      你不觉得,操纵陪审团的情绪,从而影响陪审团的决定,更容易成为律师洗罪的技巧吗?

  11. Woo说道:

    我真的真的很讨厌概率,就像"A有两个孩子,一个是男孩,另一个也是男孩的概率?"
    这类问题....怎么说都有理

    • 二两说道:

      另一个孩子是男孩的概率还是1/2

      • HappyLee说道:

        概率为三分之二无误,这是一个非常特殊的概率问题,已知的信息竟会"影响"另一个看似无关的信息...

    • pngssa说道:

      正确答案是三分之一。。。。。

  12. 留条路说道:

    这完全不能用概率来定罪,就算在小镇发生这事件的概率是1/1200万也不会有说服力,因为这1/1200万的概率恰好就是他能,因为还有1/1200万的几率而不是0的几率或者百分百的几率。

  13. octopus说道:

    希望有法学方面的松鼠来介绍下概率论是否能够用来支撑诉讼和辩护啊。

  14. 破格说道:

    总感觉这篇文章在果壳上看见过呢

  15. sophiaemmalu说道:

    非常有意思,西方想出概率这个来定犯罪,前提是西方犯罪辩护是,假定有罪,用证据证明推断无罪.但是用概率来认定一个人是否有罪,从以上几个案列来看,就发现一个概率的应用前提条件很有局限性(所以容易被推翻),二无论概率多小,我认为都不能一此作为审判依据.
    总而言之,尽管应用有局限性,但非常有意思

  16. Miller说道:

    实际上依概率1成立的事件也不是绝对事件,因此只能作为参考,不能作为证据。

  17. ckx说道:

    1 - (11999999/12000000) 4000000貌似算的是至少有一对夫妇符合描述的概率啊?不理解……

  18. albred说道:

    用概率来定罪太荒谬了。。
    概率只能解释统计意义上的一般情况,犯罪本身就是一个特殊样本,当然不符合总体特性。
    就好象在法庭上我当场掏出枪把所有人都杀了,然后按概率,发生这种事情可能性极低,然后我就无罪了。。