首页 >> 环境 >> 文章

4月17日,央视报道了一则新闻,江苏常州外国语学校自去年9月搬到新址后,近500名学生先后出现皮炎、湿疹、支气管炎、白细胞减少等异常症状,个别的还被查出了淋巴癌、白血病等。报道还称,学校北边的一片工地曾是三家化工厂。

在科学上,认定孩子们的奇怪的发病和化工厂之间存在关联,可能并非如旁观者期许的一蹴而就,那么,科学家将以怎样的工作方式展开的后续的工作呢?不妨读一下20世纪末发生在美国新泽西州汤姆斯河镇的故事,看看那里是如何“成功的”将自己确认为儿童癌症集中发病区的。

52e0001eed6e6bfbf4b

新泽西州汤姆斯河镇旧貌

汤姆斯河镇所属的新泽西州欧申县在1980-1988年间共确诊了37例儿童脑和神经系统肿瘤。按照新泽西州的平均发病率计算,这个有着八万名儿童的县应该只有22例这类肿瘤,多出15例意味着什么?是实际发病率提高了70%,除此之外,该镇在这段时间中还确诊了多例儿童白血病。

儿童癌症发病率调查:艰难的起步

小镇的经济支柱,汤姆斯河化工厂建于1949年。二十几年之后,它的污染已经成为全镇皆知的秘密。起先在化工厂工人中弥漫着的癌症阴云逐渐飘散到了周围的居民身边,从上世纪七十年代起不断有孩子被确诊为白血病、神经母细胞瘤、视网膜母细胞瘤等恶性肿瘤。眼看着一个个孩子患上癌症,家长们不可能不问一句为什么。他们请求新泽西州卫生部进行调查。汤姆斯河最初的几次请求根本没有引起这个人手不足疲于应对的部门的回应。直到1986年,一次污染引发的群体性事件之后,该地区的健康调查员出面要求州卫生部负责相关工作的迈克尔·贝里利用新开发的州癌症登记系统进行调查。

这次调查并未获得家长们预期的结果。多年之后回头再看,这次“假阴性”的原因很可能是刚刚运行6年的州癌症登记系统记录不足且明显滞后。因为人手问题,加上与医院沟通不畅,1986年时癌症登记系统的病例数据只更新到1983年。第一次的调查统计了1979-1983年间汤姆斯河镇所有12岁以下的确诊癌症病例,共15例,按当时的人口基数计算,儿童癌症“预期”发病数应该是14.7例,实际值似乎是正常的,难道是家长们的感觉错了吗?

9年过去了,1995年春,迈克尔·贝里再次接到了请求调查汤姆斯河儿童癌症集群的电话,这一次他更加无法拒绝,因为发出请求的是几位不会轻易报出“假阳性”警报的专业人士:一位美国毒物与疾病登记处的员工、一位美国环保局的员工、和一位国际顶级儿童癌症治疗中心的护士。

考虑到这些为调查背书的人的专业背景,和近十年来逐步完善的癌症登记系统,贝里信心满满的再次开始统计。

魔鬼露出了尾巴?

癌症并不是一种病,而是一类病的总称。不同类型的细胞因为不同的原因分化为不同的肿瘤。像1986年那样将它们加在一起计算发病率实在是贝里在数据匮乏时的无奈之举。这一次贝里将肿瘤按3个类型统计:全部癌症、脑/中枢神经系统肿瘤、和白血病,其中脑/中枢神经系统肿瘤又分别统计了0-4岁发病和0-19岁发病两种情况。而儿童的居住区按三层统计:最小的污染核心区、汤姆斯河全镇、和范围最大的欧申县。分别比较了上述12种情况的理论预测值,实际发病数,二者的比值(发病比),和这个比值的95%置信区间。

1995年统计结果:不同区域不同类儿童肿瘤发病比及发病比及95%置信区间

四种儿童癌症的统计类型都呈现出一个规律:越趋近污染核心区,实际病例与理论发病率的比值越高,结果直指化工厂污染地块这个靶心。

尽管直觉看来污染区的儿童癌症高发非常明显,但要在科学上证明它却不乐观。一般认为,只有发病比的95%置信区间的上下限都超过了1,才能证明从统计学上讲,95%的可能是这个病的发病率比正常高了。但这张图上,虽然每个柱都比1高,但大部分柱的误差区间都落在了1以内。除了3个:欧申县全县内0-4岁确诊的脑/神经系统肿瘤,欧申县全县内0-19岁确诊的脑/神经系统肿瘤,和污染核心区0-4岁确诊的脑/神经系统肿瘤。全欧申县的两种脑/神经系统肿瘤的95%置信区间分别是1.05-1.82和1.08-2.68。它们的发病比没有高出很多,置信区间的下限离1不远,也许还显得底气不足。但污染核心区0-4岁确诊的脑/神经系统肿瘤发病比高达7.14,95%置信区间更是高达1.44-20.87,远远超过了1。

终于,那个魔鬼露出了尾巴,尽管和家长们的预期相比,那只是一个尾巴尖儿。

重建污染与癌症的联系

证明了儿童癌症高发的现象客观存在只是第一步。它并不等于证明了这种高发是污染引起的,还需要证据把污染和病例关联起来。这是一项需要大量资金、技术和劳动才能完成的工作。在汤姆斯河,这项工作是在儿童癌症高发的结果公布,引发了近一年风暴般的群众运动之后才开始的。

最开始需要的,是识别出要分析什么关联:哪些人群,以什么方式,接触到了哪种污染?因为没有人确切的知道过去40年间化工厂周围的水里和空气里究竟有什么,这些东西又有谁接触到了多少,因此工作的难度可想而知。简单来说,经过3年时间,花费近一千万美元之后,1999年,州卫生部的杰里·法格里亚诺终于决定:调查1982年到1996年期间,母亲孕期喝到污染地块水井中抽出的地下水后,孩子患上白血病和脑/神经系统肿瘤发病率有没有升高。(其实当时还有另外两个有嫌疑的关联被调查,最后没有得出统计学意义上的关联。)

既然锁定了关联对象是某个水井和两种癌症,接下来需要的是尝试找出二者的剂量-效应关系:喝这个井里的水多的孕妇群体中,是不是产下的孩子患病人数也多。

因为水井并不是直接连入市民家中,而是经过汤姆斯河水务公司的布水系统分配到全镇的,所以需要用模型模拟推算十几年前这口水井里的水在每家的水管里占多少百分比。汤姆斯河全镇有23口水井,抽出的井水经过近五百英里的管道分散到近五万个住家或商铺中去,而且1999年要追踪的是过去几十年间不断变动的管道中每一天输送到每一个水龙头下的某一口井中的水。建模的工作从1997年启动,1999年基本完成,花费了500万美元的国会特殊拨款。

知道了患有白血病或神经系统肿瘤的孩子在母亲的子宫里喝的是什么水。还需要知道正常的孩子在母亲的子宫里喝的水是不是没有那口水井染指。除了愿意配合的患者群体,州卫生部的杰里·法格里亚诺还需要找到四倍于患者群体的,与患者有着相似的生活环境的,愿意配合调查的正常家庭。对于每一个家庭,都需要详细的访谈来确认各种患病因素。

纠结的结果

大到人类文明,小到个人认知,将直觉认定的猜想付诸数字验证都是一大进步。在实际操作的层面,也只有数字才能说服法官判定赔偿额度,或者逼迫对方律师协商和解金额。汤姆斯河有着数量巨大的有毒污染物,也有明确的儿童癌症集群,直觉看来二者似有因果关系,但这需要流行病学的检视,而流行病学,是一门关于“可能性”的科学。

到2001年年初,饮用水分配数据,患儿分布数据,家庭调查结果全部完成,终于轮到流行病学统计出场了。而汤姆斯河的统计结果可以说喜忧参半。

经过统计,证明了相比于正常儿童,患病儿童在母亲子宫中喝过污染井水的概率确实更高。但那条恼人的95%置信区间红线依旧很难越过1这道坎。法格里亚诺比较了两种接触剂量,多种疾病,多个年龄段,两种性别……等等各种因素,其中一些的结果就像这样:

针对1984年至1996年间出生,于5岁前被确诊为白血病或神经系统肿瘤的孩子,他们在出生前接触过污染井水的情况是,低剂量接触的有10人,高剂量接触的有5人。与他们情况相似的对照组中,低剂量访谈过42人,高剂量访谈过11人,因此可以计算得出其调整优势比为3.01,95%置信区间为0.78-11.60。这个数字的意思是,对于这类疾病,患者出生前大量接触过污染井水的概率比同样情况没患癌症的孩子高3倍。单看3.01是远远高于1,但这个数字的概率分布是,它95%的可能性是介于0.78到11.6之间。下限落在1以内就表示有一定的可能,患者和非患者喝的水没区别。

但也并不全是坏消息,即便是这样苛刻的统计学检验,依旧有一个患儿群体越过了1那道坎:在汤姆斯河镇20岁前被确诊为白血病的女孩中,低剂量接触污染井水的有8例,高剂量接触的有5例,同时找到了39名低剂量对照和3名高剂量对照,因而调整优势比为5.96,95%置信区间1.12-31.70。即便是这个通过了显著性检验的人群,结果也是摇摇欲坠的,如果统计的时候少搜集到哪怕一个病例,置信区间的下限恐怕就会跌回1以下。根本来说,困难在于人群太小,所以病例太少,难以通过苛刻的统计学检验。

汤姆斯河是独特的。过去的近一个世纪中,全球范围内针对污染附近居民区癌症集群的调查进行了几百项之多,能够确定癌症集群的只有五项,而能够将癌症集群与污染挂钩的只有两项,汤姆斯河便是其中之一。但它又只确定了女童白血病与某一口污染水井之间的关系。但我们不要忘记了,最初确定该地区有儿童癌症集群的,是4岁以下儿童的脑/中枢神经系统肿瘤。

不如另觅他途

波士顿大学著名环境流行病学家大卫·奥佐诺夫说过这样一句话:“对于公共卫生灾难,一个好的,有效的定义是,其健康效应如此之大,即便是用流行病学的研究方法都可以侦测得到。”可见在1这条横杠之下掩埋的是多少有污染参与,却不能被证实联系的癌症病患。

现在,统计学家已经将污染源附近居住区的癌症集群调查视为畏途,除非有新的科学手段出现,愿意进行这种调查的流行病学家将越来越少。而对于已经发生的污染事件,如果要诉诸法律,证明患者的癌症是由居住区的污染引起,恐怕不是一条可行的道路。更理智的做法是,追究污染的确切证据,以污染,而非其引发的疾病追责。

关于污染起诉的法律建议参见此文:http://weibo.com/ttarticle/p/show?id=2309403965677277981347

关于

本文材料出自2014年普利策奖最佳非虚构图书《汤姆斯河:一个美国癌症村的故事》第15、16、19、21、23章。该书的介绍参见此文:https://book.douban.com/review/7702811/

编辑:朱新娜

0
为您推荐

10 Responses to “汤姆斯河的魔鬼尾巴——来看看美国官方是如何认证癌症村的”

  1. Illusiwind说道:

    哈哈哈这还要求95%置信区间……
    我建议将这一条引入法医学,判断死者死因也要有95%置信度。死者虽然脖子上插着这把刀,但是不一定是因为这把刀而死的,可能是因为其他莫名其妙的原因恰好死掉了,然后脖子上又被插了一把刀。所以要进行统计学调差,看看在同样位置被插了同样刀子而死了的人数、插了没死的人数、没被插而自己死了的人数、没插没死的人数的统计,要是达不到95%置信度就无法判断死因。
    所以我们判案更理智的做法是,不要管被捅的人死没死,伤到什么程度,只追究“捅”这个行为的责任。

    • n/a说道:

      Ignorant

      • gundamfire说道:

        +1

        • Illusiwind说道:

          你们也就在网上骂声傻逼过过嘴瘾的水平了。要是这种事发生在你家里,你家里一半人得了癌症,法院要求你们提供疾病是化工厂污染造成的并且置信度95%的证据,你们是不是很乐意表现出自己的渊博学识?

          • iKen说道:

            這完全是兩碼事。置信度是一定數量的獨立事件統計學上尋找規律用的,你用施加在個案上來反駁有什麼意義?

          • Illusiwind说道:

            所以你的意思就是说,附近搬来了化工厂,过了十年你家里有一半人得了癌症,环境监测发现化工厂排放致癌物超标——起诉化工厂索赔,法院判决败诉,因为你家人得癌症是化工厂造成的的可能性只有94.8%,所以证据不足。你就应该心安理得地想,啊,也是呢,说不定我们就是运气不好只是随机波动多出来的癌症患者呢。要是再多0.2%就能确定是化工厂引起的了。
            个案又怎样,个案就没有不确定性?个案就没有冤假错案?你同时扔100个骰子是统计,你每次扔1个骰子扔100次也是统计。

          • iKen说道:

            是谁告诉你法院判决是以95%的统计学置信区间为标准的呢?是你有什么依据还是你自己想象出来的?

          • 白鸟说道:

            写这篇文章并不是想说污染和癌症没有关系,绝不是这个意思。我想文章里应该也没有这个意思。无论是该书的作者,还是这篇文章的作者,都只是想说,这个关系用现有的科学方法很难证明。这篇文章的目的是展现科学的局限性和问题的难度,而不是脱罪。

            所以,如果真的出现这类问题,合理的,现实的做法是文章最后说的:“而对于已经发生的污染事件,如果要诉诸法律,证明患者的癌症是由居住区的污染引起,恐怕不是一条可行的道路。更理智的做法是,追究污染的确切证据,以污染,而非其引发的疾病追责。”

            为了防止出现这种情况,我们要做的是以更严格的环境标准限制污染的排放,现阶段去证明这个关系是做不到的。

            正是因为理解患者家属的心情,所以才介绍这些知识,帮助他们以更现实的方法解决问题。

          • Nevaeh说道:

            As Charlie Sheen says, this article is "WIINNNG!"

  2. 赵明毅说道:

    怎么说呢,虽然某人的话语体现了他的无知,但是这是可以解释也应该解释(为什么正确)的。
    就拿他那个例子来说,最大的问题之一是——【脖子上插把刀】并不是良好定义的东西。
    比如换成——刀切口在10cm以上(这只是个例子),这样的话,实验结果的p值绝对比0.01低的多,有些人以为95%是多高的标准,那个p是0.05,已经是最大可以取的了。

    现实中的一切问题都是概率问题,极大似然估计是我们判断的准则。
    如果有人以为【法医判断一个死因不是依据的极大似然估计】,那是他自己无知。