首页 >> 专题:奥运 >> 文章

统计学的玩笑?
当种族和体育试图联姻之时,另有人却拿着大剪刀随时准备棒打鸳鸯。后者的证据是,体育成绩上所谓的种群差异,根本就是子虚乌有,数据假象迎合了人们趣味,从而掩盖了真相。

视觉刺激往往比数据更让人印象深刻,直观感受常常排挤掉理性思考,金牌的耀眼光芒足以将理性和冷静拒之千里。体育对数字和纪录的狂热追求,致使人们将胜负无限扩大,哪怕金银牌的差距只有0.01秒。

请暂时忘记金灿灿的荣誉,也暂时让心理学的“晕轮”效应失效,现在来还原这毫秒之差的真正含义。单次竞赛的成绩差别,对于评价一个运动员的真正水平,到底有多大意义?翻开运动员的训练记录簿,你会发现,同一运动员的成绩起伏,远远大过这微不足道的0.01秒。99分和100分的差别固然存在,不过更多的是理想主义上的,而并非学习状况的完全表现。这些微小的组间差异本该淹没在组内数据之间,但我们却对此津津乐道,历史上无数的悲情英雄证明,唯金牌化在欠缺理性思考之余,同时损伤了体育的人文精神。

0.01秒的差距,可能源于幸运女神的一个小瞌睡,也可能是肆虐的流感病毒、赛前的一盘沙拉、冲刺时的丝毫松懈、墙角一只不识趣的闪光灯、面对特定对手的心理压力、甚至可能是计时误差……无论如何,这些毫厘之差显然不是评价运动员体质的稳固根基,将由此导致的金银牌作为种族体质差异的证据,更是简单粗暴。

如果说人们对登顶成功之巅的狂热还可以理解的话,一个常用的统计学工具,却不经意间扮演了不太光彩的角色。相关性分析通过一系列复杂的计算公式,找寻两组数据是否产生关联。虽然计算公式让人头皮发麻,但电脑是安抚的绝佳梳子。几秒钟就可以整出一份长长报表,最后的相关系数那一栏告诉我们,体育成绩和种族体质之间确实存在相关性。黑人云集的田径场、清一色的白皮肤“飞鱼”、满眼黄色的小球运动……就是抽象数据之外的直观明证。

很可惜,这个数据引起的误会,远比其提供的有用信息更多。在了解数据的深层含义之前,相关性分析揭示了数据之间可能的关系,然而这种直观和简便,却使得它有逐渐被滥用的倾向,尤其是当这个结论刚好和我们的主观感受相吻合时,往往使人过分信任。

对相关性最常见的认识偏差,在于轻易将其上升到因果关系,如果解释刚好又符合直观印象或已有观念,错误将会更为严重和难以察觉。诚然,当两组数据关联密切时,很可能是因果关系(太阳升降与光照强弱);但也可能是同一事件引起的两个结果(公转周期引起南北半球季节反差);也可能是两个事件共有某些信息(长夜与高犯罪率);甚至可能毫无意义(白天时长与夜晚时长)。

如果在同一张图表上的分别画出月度煤炭消耗量和老年人死亡率曲线,将会发现这两条曲线高度平行,这说明两者之间存在较大相关性。但是,是否可以通过减少煤炭消耗来降低老年人的死亡率?在能源部和社保局合并之前,恐怕得先问过气象局的意见。

和寻找相关性相比,确定原因往往复杂得多,这需要控制变量进行反复实验。在结果出炉之前,为保险起见,当我们试图将优势项目与种族挂钩时,千万不要忘记审视一番别的可能。而竞技场上的肤色更替现象,似乎为解释体育成绩的种族优势提供了另一种可能。

竞技场上的肤色更替
面对这些枯燥的学理说教,你可能早就不耐烦了,此时你最可能的动作就是,指着百米起跑线上那一长溜的黑色身影大叫"Shut up"。

不过,如果你指着的是60年代的电视节目,画面恐怕会让你大吃一惊。1960-1984年的七届奥运会上,100-400米短跑项目的黑人冠军只是稍微过半;而在黑人基普恺特坚守800米世界纪录之前,这个纪录已经被白人保持了十多年。很显然,如果选取不同的统计时段,统计结果将和直观印象大相径庭。这不是数学老师的问题,而是因为对数据的不同处理很容易导致不同的结果,况且当这些数据和我们的直观印象有所出入时,很容易造成选择性失明--尤其在偏见已经先入为主、根深蒂固时。

哪怕是同一运动项目,优势族群可能也因时而异,这才是真正的历史。在中国人崛起之前,乒坛一直是欧洲人的天地;在威廉姆斯姐妹一统网坛的前后,白人仍是网坛的主流……而最具代表性的“肤色轮替”,当数百年来的拳坛变幻。

自约翰逊以后,整个拳坛已经被黑人霸占了整整一百年,这一素材甚至已经作为常识为人所接受。但是,进入二十一世纪后,白人又开始重掌拳坛帅印。现在的重量级拳王中,拉曼的黑色身影甚至比克里钦科兄弟的博士学位更显另类。身为乌克兰巨人,克里钦科兄弟不仅拳技出众,而且都是饱学之士。WBA重量级冠军瓦卢耶夫更是有史以来最高的拳击选手,唐金赞其为世界第八大奇迹,在连续卫冕三次之后才首尝败绩;而胜者也是一名白人选手。白人在拳坛的重新崛起,已经成了不可逆转的潮流。

拳击场上的"肤色轮