首页 >> 医学 >> 数学 >> 文章

        (已刊于《新京报》)

         坚信动物预测地震的人士们最基本的“信念”就是:地震来临之前所发生的人类不能感知到的某些信号,许多动物能够感知到。向安婆婆同学学习一下,虽然咱不是靠数学统计或者动物地质吃饭的专业人员,但是应该不妨碍咱也用点知道的数字的知识来讨论一下:退一百步,即使这条“信念”是正确的,那又如何?

        如果有一种病,发病率不算高,假设0.1%吧,一旦发生了就不可救药。但是如果提前知道,可以进行代价不小但是相对于死亡来说还可接受的防治,比如说从此不许吃肉,或者天天吃二两黄连,再或者切掉一条腿。。。在医学上有一种检测方法,可以进行早期诊断。当然就像别的检测方法一样,它总有一定的出错概率。这个方法能够做到的是:如果你有病,那么检测结果99%会是阳性;如果你没病,那么有1%的可能性结果会呈阳性。当然你仍然可以责怪医学研究人员为什么光吃饭不干活,不能让那99%变成100%,让那1%变成0%。但是,就目前的医学水平而言这也不算差了。现在,你进行了一次检测,结果呈阳性,你会怎么办?从此不吃肉?天天吃黄连?切腿?。。。

        换句话说,面对阳性率99%的检测方法得到的阳性结果,你会有多大的信心接受“有病”的判断?对于数学或者统计人士,应用条件概率的公式可以直接给出答案。考虑到很多人不习惯用数学公式来说话,我们还是换种具体直观的方式来分析吧。

       对于一个100万人口的人群进行这个疾病的普查。发病率0.1%,大致有1000人得病,99%的阳性率,所以约有990个阳性结果。没病的99.9万人中,1%会被误诊为阳性(所谓的假阳性),共有9990个阳性结果。所有检测下来,共有10980个阳性结果,其中只有990人是真正有病的,比例是9%

       好了,虽然检测结果是阳性的,但是你没病的可能性还有91%。你会选择不吃肉,每天吃黄连,或者切腿吗?

       为什么一个阳性率已经相当高(99%)的检测方法,检测出来阳性结果的时候却是91%可能没病呢?仔细看看上面的分析,不难发现:尽管只要有病就几乎肯定(99%)能被检测到,没病被误诊的概率也不高(1%),但是由于发病率很低所以真阳性的数量远远小于假阳性的数量。结果,有病固然基本上显示为阳性,但阳性结果却只有很小的概率是真的有病。

       现在让我们来玩玩数字游戏,把上面的几个数字改变一下,看看结果会发生什么改变:

       一、 保持随机发病率(0.1%)和假阳性率(1%)不变,把阳性率提高到100%,结果阳性结果时的有病概率是9.1%;阳性率降低到90%,阳性结果的有病概率则变为8.3%;如果降低到50%,则结果变为4.8%。也就是说,对于检测结果为阳性的时候得病概率的问题,表示有病情况下被检测出来的准确性(阳性率)并不是那么关键。不过这个数字的影响在于,如果低的话,检测结果阴性但是有病的可能性却还是很高,这个检测也就很成问题。

       二、保持阳性率(99%)和假阳性率(1%)不变。把发病率改为1%,阳性结果有病的概率就变成了50%;如果把发病率降低到0.01%(万分之一),则即使检测结果为阳性,得病的概率也还不到1%

       三、 保持阳性率99%,发病率0.1%不变,把假阳性率降低到0.1%,会发现阳性结果有病的概率变成了49.8%;如果假阳性率升高到5%,则这个概率只有1.9%

       好了,总结上面的数字游戏——游戏只是说随意地改变参数,算法是可靠的——可以看出:当面对一个阳性结果,真实情况如何并不全由阳性率(有病的时候能被检测到的概率)决定。真实的随机发病率和假阳性率的相对大小甚至更为重要。

       对于地震预测而言,地震相当于得病,我们用来预测地震的方法相当于检测手段,而试图用以预测地震的那些“异象”,蟾蜍过街也罢,猪不进圈也罢,相当于阳性结果。地震预测就是根据那些“阳性结果”去推测地震发生的可能性。

       现在我们来看看地震预测中的这几个参数。尽管有无数的文章从科学研究的现有结果指出地震与动物“异象”关系不大,但是许多人仅仅出于“信念”而“相信”动物有着神奇之处,在地震来临之前可以感受到并且做出反应。好吧,我们不在这个问题上费口水了,就算可以吧。按照这种“信念”,如果地震要发生,蟾蜍一定会搬家,猪一定会出圈,狗一定会叫个没完。。。把阳性率假设为100%,总不会再有口水了吧。再说地震发生,有意义的预测总得告诉人们在一个不大的地区内不长的时间内有不算低的可能性发生地震,预测“未来十年中国会发生大地震”大概没有什么实际意义。预测到一块不大的区域,比如中国行政区划上的一个地区,在几个月内有地震大概才会有一定的决策意义。想想这样的一个区域在过去几百年中发生了几次地震,可以估算在一定长度的时间段内发生地震的概率。比如500年中发生了5次大地震(这个算得上地震高发区了吧?),那么在任何一个月的时间段内发生地震的概率可以估算为1200分之一。而对于某种动物“异象”,比如蟾蜍过街或者猪不进圈,也可以统计在这500年中发生过多少次,除去发生了地震那几次,剩下的就是假阳性的次数。这个数字大概无法统计,因为没有发生地震的话人们会忽略这种“异象”而不会留下记录。不过,现在的资讯发达,过去几年全国报道过的“蟾蜍过街”不下十起,即使把绵竹的那一起勉强算作“阳性结果”,假阳性率应该还是大大高于地震发生率。这里做个保守估计,算10倍吧,那么假阳性率是120分之一。把这三个数字带入上面的分析,结果:即使地震来临之前蟾蜍一定会过街,当看到蟾蜍过街的时候,地震发生的概率也只有9.1%

        这个9.1%,还是基于上面的数字游戏中所有数字都尽可能往有利于预测的方向上靠的结果。实际上有很多地震之前并没有看到蟾蜍过街,也就是说那个100%的阳性率是不靠谱的,其次实际的地震发生率和蟾蜍过街率的差别,很可能也要远远高于10倍。所以,蟾蜍过街这个“阳性结果”,所预示的“得病概率”还会远远低于上面的结果。一个检测结果阳性的人,如果没有作防治,最后得了绝症,人们会说虽然只有百分之几的可能,但是切腿还是比得绝症好多了,当初应该接受“预测”的。但是,当初面对几个百分点的得病概率还没有发病的时候呢?当面对大量既没切腿又没得病的例子的时候呢?

        许多人又说了,谁让你只看蟾蜍的,多看些动物,假阳性率不就低了么?这话理论上是没错的。问题在于,多看些动物,比如在蟾蜍过街的同时,还要猪不进圈,狗不吃饭,鸡不下蛋。。。如此等等,同时发生来作为“阳性指标”。假阳性率可能是降低了,“真阳性率”却也同时降低了。看看过去发生的地震,有多大的比例同时达到了这些“阳性指标”?“真阳性率”降低了,地震还是不能被预测到。

        在前面疾病普查的例子中,疾病的随机发生率是0.1%,检测结果是阳性的话虽然得病的概率也不够高,但是上升到了9%。我们再在进行一次独立的检测,如果还是阳性的话,患病的可能性就高达90.7%。当然我们还可以再进行一次,还是阳性的话,得病概率就接近100%了。这也就是许多阳性结果要进行复查的原因。这里强调要“独立进行”,是因为只有复查独立进行,依据的信息跟前一次无关,计算中所用的参数才成立。但是对于地震预测来说,如何进行这样独立的复查?或许有人说可以把蟾蜍过街当作一次,猪不进圈当作一次,甚至狗不跟邻居的母狗搭讪也算作一次。这想法也不是不可以,但是当这样预测的时候,每一种预测中所用的参数都将是别的取值了,没法按照上面的计算过程简单重复了。有兴趣的人当然可以取认为合理的参数,看看这样的“预测”有多靠谱。

        如果有1%的可能要得绝症,而防治的措施是不吃肉的话,相信很多人可以做到;天天吃黄连,大概也有很多人可以接受;但是切腿呢?

        即便是我们“相信”地震来临的时候动物会有异常,根据这种“异常”来“预测”地震的可靠性能有多高?相对于地震来临,长时间大面积众多人口的躲避是相当于不吃肉,吃黄连,还是切腿?

相关文章
  1. “如果你有病,那么检测结果99%会是阳性”,剩下的1%应该是指的假阴性,即有病的但没有被检测出来。

    而假阳性比例的分母应该是所有阳性样本数,而不是所有被检测样本总数。

    “对于一个100万人口的人群进行这个疾病的普查。发病率0.1%,大致有1000人得病,99%的阳性率,所以约有990个阳性结果。没病的99.9万人中,1%会被误诊为阳性(所谓的假阳性),共有9990个阳性结果。所有检测下来,共有10980个阳性结果,其中只有990人是真正有病的,比例是9%!”

    100万人,如果按0.1%的发病率算,1000人实际生病,由于阳性率为99%,那么990人检测到了阳性,有10人是假阴性(生了病却没有被诊断出来);这990人里又有1%是假阳性结果,因此还有9.9个人(即10个人)是没有生病却被误诊为生病。那么980人为实际诊断正确的人。

    按你的算法——“共有10980个阳性结果,其中只有990人是真正有病的,比例是9%”,如果一种诊断方法误诊率为91%,谁还敢用啊。

    数学方法不能这样来玩文字游戏啊。

    • 而假阳性比例的分母应该是所有阳性样本数,而不是所有被检测样本总数。
      这是错误的。显然分母就是所有的样本总数。
      在100万人里多少人检测出了阳性呢?
      简单的用确定的数字估算一下。
      根据。如果你有病,那么检测结果99%会是阳性;如果你没病,那么有1%的可能性结果会呈阳性。
      假设1000人实际得病。那么这1000人中判为阳性的是990个
      而没病的999000中判为阳性的为9990个。总共是10980个。
      又如果一种诊断方法误诊率为91%,谁还敢用啊。
      这里只是数学概率论问题。不能上升到实际吧。

    • 我又看了一遍。认为你的错误在于。对于你提出的“如果你有病,那么检测结果99%会是阳性,剩下的1%应该是指的假阴性,即有病的但没有被检测出来”。你没有弄清这两个数值的本质。99%与1%本质上是检测的成功失败率。即检测结果与事实是否相符。也就是说。如果你有病,那么检测结果99%会是阳性。如果你没有病,那么检测结果99%会是阴性。同时如果你有病,那么检测结果1%会是阴性。如果你没有病,那么检测结果1%会是阳性.

    • 楼下们讨论都是很好滴
      看了一堆假阳性的讨论,实在是太靠前排了 为了防止连岳等人陷入到无穷的数学游戏里去,多插一句

      我也想要坐前排所以到这里来回帖,呵呵

      文章分析的是,对所有人进行病情普查的情况,而不是感到不舒服的人去医院 最后医生要求做检查的情况,后者有其他很多线索可以循证

      地球又不会自己去地震局报告他不舒服了,所以对应了人口普查的情况,预测准确率就相当低了

  2. 不知道为什么我回复后当我再次打开这个网页就没有了。。再回复一遍。对于楼上。我认为是没有理解99%与1%的本质。这两个数值是检测的成功失败率。也即检测结果与实际情况相同与否的概率。可以这样理解。
    “如果你有病,那么检测结果99%正确。是阳性”
    “如果你有病,那么检测结果1%错误。是阴性”
    “如果你没有病,那么检测结果99%正确。是阴性”
    “如果你没有病,那么检测结果1%错误。是阳性”
    这四条是同时成立的。

    • DNA并没有说错,是楼上没理解DNA的意思。
      整篇文章的主要逻辑是没有问题的,也跟现实情况大体相符,得到的结论也是靠谱的。
      DNA只是指出博主的文章里说的假阳性的确跟我们一般意义上理解的假阳性率的含义不一样。我们一般理解的假阳性率就是假阳性占监测阳性的比例。但这个问题撑死就是个用词不当的问题,不影响推理过程和结论。
      这个问题抽象出来,无非就是个条件概率问题就是:A、B是两个相关事件,如果仅仅已知P(A/B),不能推算出P(B/A)来。这个概率问题是很基本的,只不过在地震问题上,动物预测派受到了直觉的影响,没从抽象的数学角度分析预测的可行性。

      • 不是学医的,不敢肯定假阳性率到底是如何定义的。我看到的资料是“false-positive test results divided by all patients without the disease”,应该是dsjmazi和我的理解。
        但是DNA和水下把关很肯定我理解的假阳性率跟“一般意义上理解的”不一样,我又迷糊了。

  3. 这个例子好像在大学数学教材里见过。所以负责的医院是不会按照一次化验的结果来诊断病情的。一般会综合几种化验结果和其他病理特征来诊断。
    地震,因为其发生概率实在太低,在短临预报上采用不完备的方法来预测,效果实在太差了。不过也不是完全没有意义。在地震高发的日本,预报地震的思路就是宁可错报,绝不放过。所以日本地震预报非常多,但绝大多数都会很快取消。可惜这个思路对于我国地震发生频率而言是不适合的。

    • 就是如此。这个例子是讲条件概率时的经典例子,不仅仅是数字游戏。我在后面也说了,疾病检测中这种情况下需要复查,如果复查的结果还是阳性,那么有病概率就上升到了90.7%。如果第三次检查的结果还是阳性,那么有病概率接近100%,基本上可以确诊了吧。

      • 假阳性率(false positive rate,FPR),又称误诊率或第Ⅰ类错误,即实际无病,但根据筛检被判为有病的百分比。——来自百度百科
        今天饭局上特意请教了一个学医的同学问了一下,跟DNA的说法是一致的,即假阳性率为化验呈阳性但实际未患病与总化验阳性人数之比。听说好多尚在试验中的化验方法的假阳性率是非常高的,高达百分之七八十也不稀罕。

        • 特别补充一下,酒后之言,错了正常。。。

        • 后面有人说我是找茬,实在是冤枉,咔咔。
          我是一看到楼主的关于假阳性定义,就想如果一个诊断试剂盒误诊率为91%,哪里还卖得出去。
          好吧,我只能说,我所理解的假阳性和楼主的一般统计学意义上的假阳性不一样。

  4. 首页访问不了了?
    显示:
    This account has been suspended.
    Either the domain has been overused, or the reseller ran out of resources.

  5. 这个应该是要用贝叶斯公式吧,学概率论时教材里就有个这样的例子

    • 没错。很多人觉得地震肯定能让某些动物有反应,所以动物就可以用来预测地震。即使前半句是对的这个推论也不靠谱。其实用贝叶斯公式两句话就能说明的问题,为了说得“软”一些罗嗦了这么多。好像还是不够“软”。

  6. 在某些时候的地震,大震之前有人不能感觉但是动物能感觉的小震,如果小震可以用来预测大震,那么这种情况下动物的异常行为的确可以用来预报地震。从技术的角度来说,只不过是如何对动物的异常行为进行数学建模的问题。技术有难度是可以克服的,并不存在理论上的根本障碍。难道博主认为满大街的鸡飞狗跳完全没有预报的意义吗?那么你说说看这辈子你见过几次这种场面?

    只不过现代地震监测已经能够探测到小的地震了,比动物的感觉系统灵敏多了,因此完全不需要利用动物来预报罢了。

    • 这么说就是抬杠了吧,
      理查德费曼在QED里讲过,
      “现在量子电动力学已经很精确了,
      99.99999%(多少个9我忘了)是没什么问题,
      但是我也不知道为什么(为什么这个计算方法管用)”
      理查德费曼同时在不同的场合也表示过,
      即使概率计算能完美的解决问题,
      我们也应该探究概率背后的东西。

      如果地震真的是由鸡鸡狗狗引起的,
      我强烈支持楼上的决定。
      否则这么模型就像楼主说的根本没办法建立,
      勉强建立起来也没什么意义。

      • 是啊,就是这个意思。最近看到很多人坚决相信地震会导致一些异象,所以就可以用这些“异象”来预测地震。而我想说明的就是即使那个“假设”成立,用“异象”来预测还是得不到有意义的结果。

  7. 这个思路不错,我刚看了关于假阳性的数学问题,没想到你可以联系到这里,赞的!

  8. 只要明白阳性率99%的检测方法是甚么意思,这个问题就很好理解

    100个病人,用此方法检测,可以得到99个阳性结果(有一个假阴性)
    100个正常人,用此方法检测,可以得到1个阳性结果(这显然就是假阳性)
    那么当使用这种方法,进行检测时,得到一个阳性或阴性结果时,究竟有病还是无病的概率,就必然受到该疾病发病率的强烈影响.

    不过,这种计算是建立在对病人一无所知的情况下进行的,比如全民普查,才能使用主文中的计算方法。当你因为身体不适去看病,一个合格的医生决定对你进行这种检测,且结果为阳性时,你的真实发病概率,已经远远超过主文中的简单计算!这一点就不需要解释了吧。

    • 当你因为身体不适去看病,一个合格的医生决定对你进行这种检测,且结果为阳性时,你的真实发病概率,已经远远超过主文中的简单计算!这一点就不需要解释了吧。
      呃。麻烦解释一下吧。为什么会远远超过啊?

      • 因为只有当他根据其它症状,怀疑你可能是这种疾病时,才会让你去做特异性检测。(此处不考虑医院乱检测好多收费的道德问题)

      • 正如逍遥说的,当身体不适去看病时检测结果为阳性的真实发病率远远超过文中的计算。文中的计算中有一个重要参数是“随机发病率”(0.1%),这个值是基于没有任何其他信息的发病概率。当你的身体不适时,你对医生的叙述以及医生的其他观察已经提供了许多其它的信息。这种情况下,你的发病率已经远远超过文中提到的随机发病率。假如说,这种情况下医生判断你得病的可能性已经有10%了。当然,据此还不能确诊。但是如果进行那项检测,结果为阳性的话,你可以把发病率10%,假阳性率1%,和阳性检出率99%代如文中的计算过程。你会发现这种情况下的得病概率超过90%。

        • 我本来想说的是50% :),但自己没有当过医生,不敢乱说,而且每个医生的想法估计也不一样,要搞一个平均值,除非搞个调查。

  9. 统计学忘的就剩下ttest了,我个人的理解,如果在一个大样本人群里普查,用这个方法,得到1000个阳性,所谓1%的假阳性,是指这1000个阳性里的1%,就是10个是假阳性,其他99%,就是990个是真阳性,这10个假阳性,如果按照文中发病率0.1%算,样本数是990,000例,带错帽子的只是这近百万中的10个,就是只有近10万分之一。并不是楼主所计算的方法。
    不能确定这么说对不对,但感觉比较靠谱。

  10. 接着再说几句,这个方法的准确性是99%,就是说如果有1000人得病,用这个方法只能检测到990例阳性,这里面又有1%的假阳性,大约10例没有病,正真有病的人数是大约980人,漏掉了1000名病人中的20例,准确性就是98%,漏诊率是2%。
    数学游戏能把人带糊涂了,没有逻辑的数字是没有意义的。

    • 我不是学医的,但是我看到的资料里对于“假阳性率”的定义跟你说的不一样。前面也有人提到了你的这个理解,我没有任何根据说这是错的,但是我也无法认为我看到的资料是错的。
      “数学游戏”只是说里面的数字是假设的一些典型值,这个算法在多数概率教材里都有,不明白“没有逻辑的数字”指的是什么。

      • 是这样,如你文中所提,这个方法在筛查中检出率(阳性率)是1.1%,而正真的准确率只有9%,91%的误报率(没有病毒人是阳性的),这个方法是根本不可靠的,这个9%是准确率。而并非是有病的人,得到99%的阳性,准确率是99%。
        所谓逻辑问题,就是一个概念在文中的定义是前后不一的。
        再说,一个自然发病率是0.1%的疾病,一个检测方法却能在正常人中检测到1%,十倍于自然发病率,这个方法是根本行不通的。

        • 我本来就是要说明这样一种在有病情况下会99%发生的阳性(地震情况下动物异象能达到99%吗?)用来预测病情也不靠谱,不是要证明这种方法是否有用。
          假阳性率十倍于自然发病率的方法是否有,我不知道。这个“数字游戏”本来就不是介绍医学问题,而是说明这个计算过程。动物异象的发生率是否有地震发生率的10倍才是关键。我估计这个值是因为有不下十次的动物异象报道,却没有发生地震。
          再说,我在文中已经说过了。即使是你认为“根本行不通”的这个方法,在疾病谱查中照样可以用。方法就是阳性结果复查,再次阳性的话有病概率是90.7%,如果做第三次还是阳性,那么有病概率接近100%。

      • 上面91%的误报率里打错一个字,不是“没有病毒人”,是“没有病的人”,Google拼音的联想,见到病就跟毒。

  11. 搞统计的来了……假阳性(false positive = type I error)在统计里面的意思是在null hypothesis为真的情况下reject null hypothesis,简单地说,假阳性率就是把没病的人测为有病的概率。在测为有病的人中,没病的概率可能是叫做false alarm rate(假警戒率?这个我不是很懂,是做预测的人用的,我们不用),与hit rate(预测准确率?)相对应。不过我不懂医学,不知道医学里面的假阳性是否有其他定义。

    楼上说的“准确性”定义也比较模糊,真的病的人检测阳性的概率叫做sensitivity(敏感性),没病的人检测阴性的概率叫specifivity(特异性),阳性结果有病的概率是positive predictive rate(阳性预报率?),阴性结果没病的概率是negative precictive rate(阴性预报率?),这些都是accuracy(准确性)的指标。

    你的假设值算法和结论(排除定义问题)确实是很多概率书都有的,教导大家不要想当然,我很同意这个结论……

    • 呵呵,到底是专业人士,概念清楚多了(反正是比我清楚)。

    • 有病而诊断为没病应该是False negative = Type II error吧? Null Hypothesis 从没病变成有病,Type I 跟 Type II就对调了。

  12. 只用贝叶斯定理算了后验, 但是决策理论要求决策考虑风险, 即后验风险最小, 而不只是后验概率最大. 应该把9.1%乘上十万条人命.

    • 是的。决策时,应该考虑实际风险和收益。作者可以再说明一下,观察在预测准确率为何值的时候,地震局应该进行预报。

      还有两个问题需要考虑,其一:准确率无法估算。小概率事件的假设检验需要更多样本。其二:地震预测不能多做,多次失败后会导致“狼来了”效应。这方面损失不知如何衡量。

      我想这方面已经有专业的分析。不过科普一下的好。

    • 文中说过了这个9.1%只是基于假设的一些数字。这些数字的假设全是偏向于有利于预测的方面,所以实际的概率能否达到很难说。
      比如,简单想想:(1)、是不是地震必然会发生作为指标的“动物异象”?这里架设是一定会,但是看看过去发生的地震并非如此,而且每次的“异象”还不一样。(2)、“异象”发生率与自然发生率的相对大小。这里假设为10倍。看看过去几年报道过的“动物异象”次数和地震发生次数,这个数字是高是低?

      • 不是说国外对这个问题的结论有定论了么,他们所用的数据和方法应该比较准确。不知道有没有人找来看。

        • 至少美国没有,美国地理学会地震问答里面说,动物预报地震的研究集中在日本和中国。谁懂日语的去找找看?

  13. "好了,虽然检测结果是阳性的,但是你没病的可能性还有91%。你会选择不吃肉,每天吃黄连,或者切腿吗?"

    这句话是错的,我要么有病,要么没病,这里没有不确定性。不确定的是检测结果,检测结果可能对,也可能错。

    要是我就再做几遍。

    当然,地震就没办法多做几遍了。但可以算笔账啊,如果可能的损失足够大,涉及到数十万条人命,9%的可能性值不值得一搏呢?

    • 如果能给个准点准地方。就是1%也值得。关键就是。时间空间给的区间太大。人口再多。也不值得了。

    • 依我看,只有一种可能性就是——100%有病。没病的概率为0,当然这个本文没有什么太大的联系,只是说我的观点罢了。
      应该要说的是,这个病的危害能不能引起你的身体不适,毕竟人类每个人身体都藏着病菌。就像地震是一定的,只不过危害性大不大,能不能被观测到。

  14. 建议博主把阴性阳性率改为疾病检出准确率,这样简单明了,外行看这也不容易昏头

  15. 如果你有病,那么检测结果99%会是阳性;如果你没病,那么有1%的可能性结果会呈阳性。
    ____________________________________________________
    疾病检验正确率为99%,错误率为1%,不管你有病没病。罗嗦点说就是如果你有病,那么有99%的可能会被正确检出为有病,还有1%的可能会被错误检出为没病,反之亦然。

    对于一个100万人口的人群进行这个疾病的普查。发病率0.1%,大致有1000人得病,99%的阳性率,所以约有990个阳性结果。没病的99.9万人中,1%会被误诊为阳性(所谓的假阳性),共有9990个阳性结果。所有检测下来,共有10980个阳性结果,其中只有990人是真正有病的,比例是9%!
    _____________________________________________________
    对于一个100万人口的人群进行这个疾病的普查。发病率0.1%,大致有1000人得病,99%的检验正确率,所以约有990人被正确检出为有病。没病的99.9万人中,由于存在1%的误检率,仍然会有9990人被错误检出为有病。所有检测下来,共有10980人被检出未有病,其中只有990人是真正有病的,比例是9%!

  16. 阴性阳性率就像XYZ这些未知数,不够直白,数学计算中多一个未知数就好像多了一重难度,顶楼回贴的歧义我看也就由此而生,以后算术类科普应避免引入这些不必要的类似未知数的概念

    • 你赞同你说的。术语太多的确容易让行外人士迷糊。

      • 再想了想还是不用改了。毕竟这只是个例子,解释权在楼主。那个歧义有点故意找茬的味道,解释一下也就通了,全文真要这样改起来还有点不好改。或者单就那个计算部分添个通俗易懂的版本?我也是看了土摩托的推荐跑来这的。他推荐的两篇比较起来还是这篇通俗易懂些,那篇没有些专业知识还真不好理解,反正我是没太看懂

  17. 一个最基本的问题~
    并不是说预测地震~除了让人们躲避就没有意义~
    甚至说~十年内此地区有地震
    也不是没有意义~
    起码你可以加固建筑~普及地震常识~加强演习吧~
    我是在土摩托推荐下来到这里~
    我觉得看这和土摩托的博客的人很少看连岳博~
    看连岳博的人也很少看这里~

    • 我是看连岳博客的,而且连岳别的文章也看了不少。最近连岳的表现让人大跌眼镜。。。

      • 我觉得连岳的态度是对的,下面的评论才是大跌眼镜,哈哈

        • 你是冒牌的anpopo吧?安同学不是撰文支持地震目前不可预测的说法了吗?跟连岳的观点完全相反啊。。。

          • 是真的。。。以头戗地中。。。这下可真麻烦
            一马还一马,理由同lx。能不能预测是科学讨论,有没有防震措施是另一回事。说地震局没能预测这次地震或者不相信动物的事先反应,这样的指责确实不靠谱;但这不是把所有责任都推掉的借口。连岳的矛头是指向后者的,何况他所引的资料就来自地震局自己的网页。说可以预测的是他们,说不行的也是他们。太平的时候就拿“预报成功”往脸上贴金,灾难来了就拿“不能预报”推脱责任,哪有这么便宜的事。

            • 这次是我跟很多人一起sb了,没看出连先生这么深远的意味。至于gov的问题。。。心照不宣了,我是非暴力打酱油派的。。。

  18. 前提就错了,还讨论这么半天。动物预测地震。
    我相信专家比动物行得多。

    • 这是你的理解错误,没有人认为动物能够预测地震(拟人化修辞?),而是说人(可以是专家)利用动物的异常行为来预测地震。这个前提没什么问题。

      • 还真有人回复。我的意思就是你“修改”过的意思。非要说成你那样才行吗?我是针对博主的文章说的,所以我意思就是“博主拿普通人靠观测动物来预测地震说事毫无意义”。
        不过你说对了一点“专家利用动物的异常行为来预测地震。”这很对。专家可以利用他们已有的知识和严格的实验排除动物异常行为的其它诱因从而达到辅助技术手段的目的。而不是简单地进行不科学的辟谣。专家应该严谨一点儿。

        • 我没有说过“普通人”怎么样,也不知道“专家”和“普通人”如何区分。目前用干旱、动物异常等等做出“预测”的那些人,算“专家”还是普通人?
          我一百万分赞同"专家应该严谨一点",什么样的预测算严谨?

          • 目前我不知道还有没有用动物异常做出预测的专家。我认为或许我们的专家已经放弃了这一方法(注意我并没有说他们这样做是错误的)。我或许会在后面跟贴更详细地说明什么是我理解的用动物异常做出预测的专家,欢迎批驳。
            我粗略地看过旱震理论这本书,我认为旱震理论的作者是专家,我认为此书比较严谨,但此理论或许如某些人所说,仍需更多验证和解释。我想就这点来看质疑他的人也有他的理由。但我希望如果有人要全面否认此学说(我认为这是极不科学的做法)就请用专业知识全面批驳这本书。但这里我不想和任何人讨论这点,毕竟博主的文章着眼点是利用动物预测。
            如果有人要讨论预报和不预报对经济的影响我想地震社会学已经说得够全面和详细了。博主的分析如果能经得起众人的推敲,恐怕只能算其中的一小部分。我也明白发出地震预报不是一件容易的事情,但这件事并不仅仅是公共决策的问题,还可能(注意这个字眼)有私人利益掺杂其中,让本来就不容易的决策复杂化。
            http://www.cnki.com.cn/Article/CJFDTotal-DZXK198101013.htm

  19. 看完以后就在想,数学原理是这样没错,可是要真这样,那我们看病也太不靠谱了,虽然世界公布的误诊率普遍在30%以上(这些还都是发达国家的数据),不过要是90%的误诊率,那还真不如在家门口挖点草根吃呢,反正一样都不是对症下药。

    后来想想,没那么可怕,虽然这篇算的数学原理都对,但是实际应用起来并不是这么回事。

    理由就是 underwater8 在 2008.05.24 12:09, 说:
    这个例子好像在大学数学教材里见过。所以负责的医院是不会按照一次化验的结果来诊断病情的。一般会综合几种化验结果和其他病理特征来诊断。

    现实里应用也是这样,只要增加一个观测参数,换言之,多一个独立化验结果,最后的概率就会很不一样。

    采用和原作者一样的假设, 发病率0.1%吧。在医学上检测两个独立参数,比方一个看红细胞沉降比,另一个看某一个酶活性,这两个检测假设假阳性比率都是1%,换言之:如果你有病,那么检测结果99%会是阳性;如果你没病,那么有1%的可能性结果会呈阳性。

    ok,我个人分析如下,

    事件A,是路人甲确实得了这个病。 事件A发生的几率写为P(A), P(A)=0.1%, 因为它就是发病率。

    事件B,是路人甲两个独立检测结果都是阳性。 事件B发生的几率写为P(B).
    P(B)= P(有病而且被检测出两阳性) +P(没病而且被检测出两阳性)
    =P(A) *99%*99% +[1-P(A)]*1%*1%
    =0.09801%+0.00999%
    =0.108%

    现在我们是已知路人甲两检测结果都是阳性,倒推路人甲确实有病的概率。 这是条件概率。写为P(A|B),即已知B已经发生,问A发生的概率。

    根据条件概率公式,
    P(A|B)= P(AB)/P(B)

    其中P(AB)代表AB两事同时发生的几率,也就是我刚算过的P(有病而且被检测出两阳性)= 0.09801%

    因此P(A|B)= P(AB)/P(B) =0.09801%/0.108% =90.75%

    也就是说,只要多一个独立检测结果,当某人被查出两阳性时,就有90.75%的几率他确实生了病。 现实中要多找几个独立检测参数不难,大多数研究者拿了钱每天都在干这回事。

    • 不用另一种检测参数,复查就可以了。前面逍遥已经讨论过,我在原文中也说过了,就不重复了。本文不是讨论看病,提这个例子只是为了说明算法。

      • 不用另一种检测参数,地震确实没办法依靠蟾蜍过街或者猪进不了卷任何一种阳性表征来进行复查,但假如采用第二种检测参数呢?依靠动物表征来预测的正确几率不就提高了很多,这点不知道是想错了还是怎么了,我绕不过去。

  20. 黄连貌似是中药啊!看来中药对于预防癌症还是有用的。

  21. 问题是我现在CD4下降CD8上升,检测却一直是阴性,该怎么办

  22. Pingback: 科学松鼠会 » Blog Archive » 【置顶】科学松鼠会之地震专辑

  23. 数学没学好,看不懂这些东西。
    个人看法:
    1,动物应该不会预测地震,但是如果有地震将要发生,可能会有某种信号发出,比如人类或者人类发明的仪器接受不了的声波,而动物可以接收到。动物因此产生恐慌或者异动

    2,应该并不是所有的动物异动都是地震的信号,也许太阳黑子的变动,或者蟾蜍界政坛暴动也会引起蟾蜍游行过街。但是动物的异动可以提醒人类可能有会不正常的现象,起码地震监测当局可以加强警戒。

    3,在没有精确手段预测地震的当今,貌似蟾蜍比地震预测当局可靠。

  24. 楼上的既然都自己承认“数学不好”了,那还好意思来看这些自然科学的东西,甚至还主观臆断的说蟾蜍更可靠?
    自然科学,请数学盲们走开。

    • 确实。我最讨厌一帮纯文科思维的人对理工科的事务妄加谈论了。

      人文科学讨论的是感性的东西,也就是每个人的天性,那些与生俱来或至少深深扎根于文化之中的思想和情感。所以,任何一个正常的人,哪怕离专业的研究和创作还有巨大的距离,都可以轻易地理解和感受人文科学的研究对象,并且无师自通地理解人文科学的常识。一定兴趣+一点业余时间,就可以成为一个好的amateur。那是因为人文科学的思维模式,最近于人类之自然。

      社会科学呢,虽然其思维模式离人类的“天性”较远,但是一个人类社会的成员,浸淫在一定的组织架构和文化背景中,耳濡目染,想理解一些常识也不是难事。而且社会科学的常识,每天为人处世都无法避开,所以这种内在驱动力,也使得社会科学的思维通俗而普及。

      而自然科学这高度理性而高度象牙塔的科学,离人类的本性是最远的,而且其知识,特别是基础的理论知识,天生就是象牙塔的——外行既很难真正理解,也基本用不着去理解。其各个学科的思维模式,非经过专门的训练和长时间的思索,是难以掌握的。所以自然科学是最难以普及,也是最不欢迎amateur的。没有经过思考方式上的特地调整和矫正,say nothing of 知识上的系统积累,就对自然科学妄加谈论,是毫无意义的,也是非常危险的。

      所以我支持本文作者和其他科普人士的精神,但是怀疑他们的做法的意义。这帮非理工科专业出身的人,缺乏理解理工科内容的素质不说,更可怕的是在没有资格质疑的情况下还愣要质疑自然科学科班出身人士的结论。这已经不是文艺复兴那样,一个小土包子有点智商和魄力就能挑战宗教权威的时代了!

      • 我在博客上说过这样的话:很多时候科学的真相很令人沮丧,远不如宗教的“真理”或者人文的“追求”赏心悦目。但是世界是按照科学真相描述的方式运行的,不管人们愿不愿意“相信”。做科研的人有责任有义务把科学的真相告诉公众,尽管用科学的冷酷来打破人们的美好“愿望”是一件很残忍的事情。很多时候介绍科学的真相招来谩骂,我总是以“只要能够改变几个人的错误观念及就算有意义”来安慰自己。

        • 我认同您的责任感,但是我还是怀疑您的效果。知识的暂时匮乏完全不是问题,素质的暂时低下也不是什么麻烦。但是我还是认为,在没有思辨的基础时就强行思辨质疑——而且这些人经常是一开始就带着“怀疑”的有色眼镜来看待自然科学——才是最恶心的,“孺子不可教”。

          此外,作为物理系的学生,我感觉不堆砌数学公式而谈论自然科学,并不是说不可能或者没意义,但那是需要非常深的功底的。我觉得只有讲解我非常熟悉的内容时,我才能在罗列公式以外,用一些自然语言(相对于“数学语言”)来探讨问题。所以讲解科学,如果不是功力深到一定地步,还是完全依赖数学来讨论吧。读者自己的能力问题就不必太在乎了,毕竟我的一位老师说“连微积分都不熟悉的人,是不配谈论理化生的。”

          • 学数学的人飘过.....
            不过我觉得,文科生来看看也未尝不可,干吗赶人走呢...
            他质疑,就用他能理解的方法来解释,毕竟,自然科学应该是一个尽管崇尚智慧和理性,但是充满人文关怀的领域

      • 咔咔,我看到了自然科学人士对人文社科人士赤裸裸的优越感。

        • 您是正确的。我个人一直面对人文社科人士有强烈的优越感。那是因为,我可以和他们探讨诗歌散文和政治历史,并显示不输于他们的知识积累(量化而言,就是阅读量)和分析能力。但是他们无法进入我的主场作战。

          GRE的阅读中,人文社科的文章显著多于自然科学的文章,而不多的自然科学文章,不仅很少涉及理工科,而且都较浅。那是因为,不管什么专业的考生都有足够的常识来理解人文社科的文章。但是同样深度的自然科学的文章,只有本科受过一些训练的人,才能自如阅读。

          有些地区高考分文理。据我观察,理科班的考生在语文英语上的分数一点不低于文科班的,但是文科班的数学分数远远被理科班拉在了后面,害得我那届高考全校前20没有一个文科班的人。所以现在高考,数学分文理,语文和英语就不分。

          • 咔咔,我又看到了TOP 10的尖子生的自信。
            我认为科学的思维是:客观、理性、尊重、宽容;对于我们依然未知的自然、社会形态以及人类深邃的精神世界,同时保持谦卑而开放的态度。

        • amateur这个词在汉语中一般对应“业余爱好者”,但是其细腻的含义中带有“热情有余而基础不足”的色彩,符合我的需求。

          say nothing of,表“更不必说”,这里是为了达到强调的效果。用英文是在无法设黑体斜体时,使一些词醒目的好办法。

          • 那你的汉语功底实在是。。。
            引号有一个作用就是加强突出

    • 我数学不好,只知道E=hv,只知道E=mc2,看不懂巴尔末公式,即使给我普朗克黑体公式的所有参数我也算不出来黑体的波长,但我“很好意思”看量子物理,“很好意思”看《从一到无穷大》,“很好意思”看《时间简史》,“很好意思”来松鼠会,虽然我不会微积分,虽然我是数学盲。

      知道为什么现代中国的科学水平要落后别人吗?因为有些人不屑把科学普及给所有的人,除了松鼠会。

      PS:本人是世界TOP10艺术院校的艺术系本科生。

      • 问题是美国科学普及了那么多年evangelical也没见少啊,畅销书第一名永远是斯蒂芬金的怪力乱神。

        • 没错,同意,所以科普的道路任重而道远,需要像松鼠会里这些大牛们一代又一代的努力。

          至于某些所谓什么物理系的高材生,如果您的文学水平够好,如果您在我们的主场也游刃有余,那请您也写出一部类似《时间简史》的书给我们普及普及一下好吗?必须要用60%的篇幅写公式吗?那只能说明您的文学水平还差得很远。

          物理系的高材生,您懂长镜头吗?您知道几种蒙太奇?您知道如何越轴?虽然您不懂这些,但并不妨碍您看《小武》、《Martix》和《疯狂的石头》,并不妨碍您发表对影片的见解,对吧?同样,我们不懂微积分,但同样不妨碍我们来学习科学知识,对吗?

          • 这条留言恰恰证明了lightsaber的观点,而且逻辑白痴到理工科不屑来理会的地步了。我是文科出身,日常工作就是做电视,剪片子,您说的那点事儿只要有基本正常智商的人一天就能知道,谁都能上手做。当然做出的活儿跟艺术创作沾边,所以在他人眼中高下有别,但根本不存在懂与不懂,或正确与错误的问题。而面对高深的纯自然科学理论,只存在经过层层公式严密论证后的正确理解;如果没有相关领域的基础,没有多年的浸淫和严格训练,缺乏严密强大的抽象思维逻辑思维能力,就想对其指手画脚,只能让人佩服无知无畏的勇敢。

            • 在科学巨人的面前,对于我来说永远是只敢洗耳恭听,只敢听大牛们发表不同的观点,自己多听多看,因为我不懂微积分不懂数学。

              你的看法也白痴到了极点。是你的理解力有问题吗?我不懂数学,所以我不敢指手划脚。可是我不懂数学就不可以来“学习”科学知识了是吗?我不懂就不可以提出问题了吗?如果你赞同那两位的观点,那你应该走开,因为他们明确地说了这里不是学文科的人来的地方。

              另外,艺术除了高下之外也有正确和错误。

              再另外,如果谁一天能看完讲长镜头和蒙太奇的书,我都会叫他老师。

              还有,做电视剪片子只是操机,不需要学习艺术,那不是艺术,那是机器,操机员是不需要动脑子的,职高毕业的学生会使XP就足够。

  25. 真没想到这里的人竟然在这些鸡毛蒜皮的细节上纠缠,根本脱离了作者的初衷。

    先转载我在另一个网站上发表的言论吧,虽然貌似相关性不太大。

    “可以说,从普通民众,到政客官员,都不理解自然科学和自然科学家,也不知道他们需要什么。或者说,他们知道,就是不愿意给。

    我们自然科学的学者需要的,就是一个脱离实用价值的“做学问”的环境。我们研究地震,你必须在经费上予以绝对支持。投入了经费,能预报地震吗?短时间内不能,短时间内经费全都打了水漂。但是,如果你觉得这个有点疼,不愿意拿一沓沓的人民币或美元往大海里白扔,对不起,地震预测永远是梦想,而国家的自然科学也永远得不到发展。

    拿老百姓的血汗钱,养肥一帮精英,不要求他们做什么“实用”的成果。并且顶住这些白丁草民的抗议,坚持拿钱快乐地打着水漂。这,就是我们自然科学家所需要的。

    可恨啊,为什么很少有政府有这个打水漂的魄力呢?”

    P.S. 本人是某TOP 10高校的物理系的本科生

  26. 我不打算切腿,所以不用告诉我检测结果,不管我是病死还是被破房子压死。还有,我支持医学检验和地震预测,至死不渝。

  27. 我觉得至少专家对动物的辟谣是不科学的,他们根本无法知道“不是地震的概率”却硬上弓说知道“不是地震的概率”是100%。

    • 其实也没有证据表明动物行为完全不能与地震挂钩。现实的问题在于:把预报准确的概率,和迁徙花费:地震损失的比值,拿来比较,就马上可以发现是否值得。

      然而公众,包括楼上的不少朋友,都是非理性而片面的。他们只看到地震损失,而没有看到风声鹤唳的转移迁徙对国家和对迁徙者个人的消耗。他们只会抓住一点马后炮的现象大做文章,而丝毫不理性地考虑如果我们真拿这些作为预报标准,会遇到多少现实的困难。

      所以专家只好一棒子打死地对“动物说”辟谣了,因为非理科专业出身的人都听不懂辩证的话嘛。

      • 我认为正是这些所谓的专家的不辨证的态度让他们最后的话显得不严谨易被质疑。

        • 至于人家对科研的态度是否辩证,不要读他们在公众媒体上的言论,请读他们在专业期刊上的论文。哦当然了,前提是你读得懂。

          这就是为什么我觉得科普吃力不讨好的缘故。讲深了,一般人看不懂,挨骂。讲浅了,一般人找点破绽就轰击,也挨骂。所以这就是我强调的:读者的态度问题。读者如果预先假设一篇文章/一个学说是有漏洞的,在此前提下寻找论据证明之,这个多半可以成功,但是这位读者永远都学不到真东西。

          • 你好,“态度”的意思很明确了,请你先读懂我的话,如果不懂可以去翻新华字典。并且我并没有质疑博主的论证过程,这点也请理解清楚。
            至于对这次动物异象的研究论文,你倒找篇出来。

            • 没错,“态度”的意思很明确,一如我的观点:
              1、自然科学的专家在学术刊物上发表言论和在科普媒体上发表,从思路到心态到态度都是不同的。你们最提倡辩证分析,却由“专家在科普媒体上有不辩证的漏洞”武断推广到“专家的不辩证的态度”,这个不是很可笑吗?

              2、如果你说要专家拿对待论文的态度对待科普作品,这个本身完全没有问题。问题在于读者是否“配”读这样的论文。一则是否读得懂,二则是否有足够的虚心来维持专家们的耐心。别的就不要求了,我也质疑过课本上的结论,但是我至少会推他三五页A4纸的算式,然后把这些草稿纸装订好给师友们过目。能做到这一点,我估计专家们就有心情拿出点正经态度来对待科普了。

              3、我回复中说“专业期刊上的论文”,你改为“动物异象的研究论文”有偷换概念之嫌。也许你马上会攻击“怎么你们这些专家不给我现写一篇呢?”,但是信不信由你,很多外行人自以为是的“挑战权威”在我们科班出身的人眼中都不值一驳。比如白痴们叫嚣的“推翻相对论”,我随便拉一个本系同学就能驳斥个体无完肤,但是这种垃圾言论太多了,让我们驳斥又不给我们发工资,还上不上课了?“动物异象”也是如此。

              当然,如果janvier批给我经费的话,我可以研究之,拿数字彻底平息争端。只是搜集数据的花费,我想大致和汶川这次的经济损失总和相当。而且,哪怕研究结果表明:动物异象和地震有显著正相关,那么每天持之以恒地观测全国的动物作为预警,在经费上的需求,请诸位自己估算吧。

            • 1、棉竹5月5日“市林业局与记者一行当即展开调查,发现小蟾蜍聚集面积大约有二十亩,主要分布在制药厂周围,进一步调查后发现在制药厂后有一条排水沟,其水温略高于其他水沟,这里的小蟾蜍也最多。最后,市林业局向当地群众解释道,这种情况是正常现象”。这里只是单纯的一次性调查,可没看见有谁因此发表任何论文。我说的态度完全不能用应在学术刊物上。非要把我说的态度扯在风马牛不相及的学术刊物上,不是相当可笑吗?当然,我认为专家态度不太辨证,只是因为我觉得高危区附近应该再请地震学家去检测一下(这一点会花掉多少经费?)才好排除。如果有人想要辩驳我的话,可以说你认为林业局专家分析已经很到位了。但我认为可能不太到位,新闻上那一丁点儿资料是不能否定我的看法的。
              2、我觉得读者再笨结论还是懂得的。给读者写这么多推论是想要浪费读者时间,还是想显摆什么?
              3、我相信对于动物异象已有研究论文,但研究和做调查是完全不同的两个概念。这次做调查的只有林业局的专家。我认为按照博主的观点,在高危地区,通过这样一次调查就决定是由生态环境引起的同样不是非常严谨,或许应由地震专家再来调查一下。希望你能看懂这篇博文。
              4、数学系为什么也要语文和外语成绩?因为阅读能力有问题的话,不能理解文章内容,或许可以解题,但是不能正确建模也白搭。
              5、你还是没有理解我对博主分析的看法,你看过我在下面的回复没有?观察全国的动物异象有必要吗?
              上面的段落可以总结成两句话:我只是觉得地震专家应该重视在很可能发生大震级地震的地方有可能引起地震的异象而已。至于哪些地方很可能发生此类地震,希望不知道的人补补功课。

            • “可能引起地震的异象”改为“可能和地震的发生相关的异象”。

  28. 由于这是虚拟的例子,我的想法是,大家为什么在讨论灵敏度,而不是考虑临床路径或EBM/EBHC呢?

    一个法官,看见一堆基础科学、统计学专业人士在厅下兴奋不已,他的想法只会是把诸位拖出去100遍又100遍。