<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>科学松鼠会 &#187; 统计决策</title>
	<atom:link href="http://songshuhui.net/archives/tag/%e7%bb%9f%e8%ae%a1%e5%86%b3%e7%ad%96/feed" rel="self" type="application/rss+xml" />
	<link>http://songshuhui.net</link>
	<description>让我们来剥开科学的坚果</description>
	<lastBuildDate>Fri, 10 Feb 2012 11:00:29 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>检测结果是阳性，你病了吗</title>
		<link>http://songshuhui.net/archives/216</link>
		<comments>http://songshuhui.net/archives/216#comments</comments>
		<pubDate>Sat, 24 May 2008 01:14:42 +0000</pubDate>
		<dc:creator>云无心</dc:creator>
				<category><![CDATA[医学]]></category>
		<category><![CDATA[数学]]></category>
		<category><![CDATA[动物预感]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[地震]]></category>
		<category><![CDATA[统计决策]]></category>
		<category><![CDATA[随机事件]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=216</guid>
		<description><![CDATA[        （已刊于《新京报》）          坚信动物预测地震的人士们最基本的“信念”就是：地震来临之前所发生的人类不能感知到的某些信号，许多动物能够感知到。向安婆婆同学学习一下，虽然咱不是靠数学统计或者动物地质吃饭的专业人员，但是应该不妨碍咱也用点知道的数字的知识来讨论一下：退一百步，即使这条“信念”是正确的，那又如何？         如果有一种病，发病率不算高，假设0.1%吧，一旦发生了就不可救药。但是如果提前知道，可以进行代价不小但是相对于死亡来说还可接受的防治，比如说从此不许吃肉，或者天天吃二两黄连，再或者切掉一条腿。。。在医学上有一种检测方法，可以进行早期诊断。当然就像别的检测方法一样，它总有一定的出错概率。这个方法能够做到的是：如果你有病，那么检测结果99%会是阳性；如果你没病，那么有1%的可能性结果会呈阳性。当然你仍然可以责怪医学研究人员为什么光吃饭不干活，不能让那99%变成100%，让那1%变成0%。但是，就目前的医学水平而言这也不算差了。现在，你进行了一次检测，结果呈阳性，你会怎么办？从此不吃肉？天天吃黄连？切腿？。。。         换句话说，面对阳性率99%的检测方法得到的阳性结果，你会有多大的信心接受“有病”的判断？对于数学或者统计人士，应用条件概率的公式可以直接给出答案。考虑到很多人不习惯用数学公式来说话，我们还是换种具体直观的方式来分析吧。        对于一个100万人口的人群进行这个疾病的普查。发病率0.1%，大致有1000人得病，99%的阳性率，所以约有990个阳性结果。没病的99.9万人中，1%会被误诊为阳性（所谓的假阳性），共有9990个阳性结果。所有检测下来，共有10980个阳性结果，其中只有990人是真正有病的，比例是9%！        好了，虽然检测结果是阳性的，但是你没病的可能性还有91%。你会选择不吃肉，每天吃黄连，或者切腿吗？        为什么一个阳性率已经相当高（99%）的检测方法，检测出来阳性结果的时候却是91%可能没病呢？仔细看看上面的分析，不难发现：尽管只要有病就几乎肯定（99%）能被检测到，没病被误诊的概率也不高（1%），但是由于发病率很低所以真阳性的数量远远小于假阳性的数量。结果，有病固然基本上显示为阳性，但阳性结果却只有很小的概率是真的有病。        现在让我们来玩玩数字游戏，把上面的几个数字改变一下，看看结果会发生什么改变：        一、 保持随机发病率（0.1%）和假阳性率（1%）不变，把阳性率提高到100%，结果阳性结果时的有病概率是9.1%；阳性率降低到90%，阳性结果的有病概率则变为8.3%；如果降低到50%，则结果变为4.8%。也就是说，对于检测结果为阳性的时候得病概率的问题，表示有病情况下被检测出来的准确性（阳性率）并不是那么关键。不过这个数字的影响在于，如果低的话，检测结果阴性但是有病的可能性却还是很高，这个检测也就很成问题。        二、保持阳性率（99%）和假阳性率（1%）不变。把发病率改为1%，阳性结果有病的概率就变成了50%；如果把发病率降低到0.01%（万分之一），则即使检测结果为阳性，得病的概率也还不到1%。        三、 保持阳性率99%，发病率0.1%不变，把假阳性率降低到0.1%，会发现阳性结果有病的概率变成了49.8%；如果假阳性率升高到5%，则这个概率只有1.9%。        好了，总结上面的数字游戏——游戏只是说随意地改变参数，算法是可靠的——可以看出：当面对一个阳性结果，真实情况如何并不全由阳性率（有病的时候能被检测到的概率）决定。真实的随机发病率和假阳性率的相对大小甚至更为重要。        对于地震预测而言，地震相当于得病，我们用来预测地震的方法相当于检测手段，而试图用以预测地震的那些“异象”，蟾蜍过街也罢，猪不进圈也罢，相当于阳性结果。地震预测就是根据那些“阳性结果”去推测地震发生的可能性。        现在我们来看看地震预测中的这几个参数。尽管有无数的文章从科学研究的现有结果指出地震与动物“异象”关系不大，但是许多人仅仅出于“信念”而“相信”动物有着神奇之处，在地震来临之前可以感受到并且做出反应。好吧，我们不在这个问题上费口水了，就算可以吧。按照这种“信念”，如果地震要发生，蟾蜍一定会搬家，猪一定会出圈，狗一定会叫个没完。。。把阳性率假设为100%，总不会再有口水了吧。再说地震发生，有意义的预测总得告诉人们在一个不大的地区内不长的时间内有不算低的可能性发生地震，预测“未来十年中国会发生大地震”大概没有什么实际意义。预测到一块不大的区域，比如中国行政区划上的一个地区，在几个月内有地震大概才会有一定的决策意义。想想这样的一个区域在过去几百年中发生了几次地震，可以估算在一定长度的时间段内发生地震的概率。比如500年中发生了5次大地震（这个算得上地震高发区了吧？），那么在任何一个月的时间段内发生地震的概率可以估算为1200分之一。而对于某种动物“异象”，比如蟾蜍过街或者猪不进圈，也可以统计在这500年中发生过多少次，除去发生了地震那几次，剩下的就是假阳性的次数。这个数字大概无法统计，因为没有发生地震的话人们会忽略这种“异象”而不会留下记录。不过，现在的资讯发达，过去几年全国报道过的“蟾蜍过街”不下十起，即使把绵竹的那一起勉强算作“阳性结果”，假阳性率应该还是大大高于地震发生率。这里做个保守估计，算10倍吧，那么假阳性率是120分之一。把这三个数字带入上面的分析，结果：即使地震来临之前蟾蜍一定会过街，当看到蟾蜍过街的时候，地震发生的概率也只有9.1%。         这个9.1%，还是基于上面的数字游戏中所有数字都尽可能往有利于预测的方向上靠的结果。实际上有很多地震之前并没有看到蟾蜍过街，也就是说那个100%的阳性率是不靠谱的，其次实际的地震发生率和蟾蜍过街率的差别，很可能也要远远高于10倍。所以，蟾蜍过街这个“阳性结果”，所预示的“得病概率”还会远远低于上面的结果。一个检测结果阳性的人，如果没有作防治，最后得了绝症，人们会说虽然只有百分之几的可能，但是切腿还是比得绝症好多了，当初应该接受“预测”的。但是，当初面对几个百分点的得病概率还没有发病的时候呢？当面对大量既没切腿又没得病的例子的时候呢？         许多人又说了，谁让你只看蟾蜍的，多看些动物，假阳性率不就低了么？这话理论上是没错的。问题在于，多看些动物，比如在蟾蜍过街的同时，还要猪不进圈，狗不吃饭，鸡不下蛋。。。如此等等，同时发生来作为“阳性指标”。假阳性率可能是降低了，“真阳性率”却也同时降低了。看看过去发生的地震，有多大的比例同时达到了这些“阳性指标”？“真阳性率”降低了，地震还是不能被预测到。         在前面疾病普查的例子中，疾病的随机发生率是0.1%，检测结果是阳性的话虽然得病的概率也不够高，但是上升到了9%。我们再在进行一次独立的检测，如果还是阳性的话，患病的可能性就高达90.7%。当然我们还可以再进行一次，还是阳性的话，得病概率就接近100%了。这也就是许多阳性结果要进行复查的原因。这里强调要“独立进行”，是因为只有复查独立进行，依据的信息跟前一次无关，计算中所用的参数才成立。但是对于地震预测来说，如何进行这样独立的复查？或许有人说可以把蟾蜍过街当作一次，猪不进圈当作一次，甚至狗不跟邻居的母狗搭讪也算作一次。这想法也不是不可以，但是当这样预测的时候，每一种预测中所用的参数都将是别的取值了，没法按照上面的计算过程简单重复了。有兴趣的人当然可以取认为合理的参数，看看这样的“预测”有多靠谱。         如果有1%的可能要得绝症，而防治的措施是不吃肉的话，相信很多人可以做到；天天吃黄连，大概也有很多人可以接受；但是切腿呢？         即便是我们“相信”地震来临的时候动物会有异常，根据这种“异常”来“预测”地震的可靠性能有多高？相对于地震来临，长时间大面积众多人口的躲避是相当于不吃肉，吃黄连，还是切腿？]]></description>
			<content:encoded><![CDATA[<p>本文作者：云无心</p>
<p class="MsoNormal"><span><img class="alignleft size-medium wp-image-59228" title="阳性" src="http://songshuhui.net/wp-content/uploads/2008/05/20110426104549520-300x258.jpg" alt="" width="300" height="258" />        （已刊于《新京报》）</span></p>
<p class="MsoNormal"><span>         坚信动物预测地震的人士们最基本的“信念”就是：地震来临之前所发生的人类不能感知到的某些信号，许多动物能够感知到。向安婆婆同学学习一下，虽然咱不是靠数学统计或者动物地质吃饭的专业人员，但是应该不妨碍咱也用点知道的数字的知识来讨论一下：退一百步，即使这条“信念”是正确的，那又如何？</span></p>
<p class="MsoNormal"><span>        </span><span>如果有一种病，发病率不算高，假设</span>0.1%<span>吧，一旦发生了就不可救药。但是如果提前知道，可以进行代价不小但是相对于死亡来说还可接受的防治，比如说从此不许吃肉，或者天天吃二两黄连，再或者切掉一条腿。。。在医学上有一种检测方法，可以进行早期诊断。当然就像别的检测方法一样，它总有一定的出错概率。这个方法能够做到的是：如果你有病，那么检测结果</span>99%<span>会是阳性；如果你没病，那么有</span>1%<span>的可能性结果会呈阳性。当然你仍然可以责怪医学研究人员为什么光吃饭不干活，不能让那</span>99%<span>变成</span>100%<span>，让那</span>1%<span>变成</span>0%<span>。但是，就目前的医学水平而言这也不算差了。现在，你进行了一次检测，结果呈阳性，你会怎么办？从此不吃肉？天天吃黄连？切腿？。。。</span></p>
<p class="MsoNormal"><span>        换句话说，面对阳性率</span>99%<span>的检测方法得到的阳性结果，你会有多大的信心接受“有病”的判断？对于数学或者统计人士，应用条件概率的公式可以直接给出答案。考虑到很多人不习惯用数学公式来说话，我们还是换种具体直观的方式来分析吧。</span></p>
<p class="MsoNormal"><span><span id="more-216"></span></span></p>
<p class="MsoNormal"><span>       对于一个</span>100<span>万人口的人群进行这个疾病的普查。发病率</span>0.1%<span>，大致有</span>1000<span>人得病，</span>99%<span>的阳性率，所以约有</span>990<span>个阳性结果。没病的</span>99.9<span>万人中，</span>1%<span>会被误诊为阳性（所谓的假阳性），共有</span>9990<span>个阳性结果。所有检测下来，共有</span>10980<span>个阳性结果，其中只有</span>990<span>人是真正有病的，比例是</span>9%<span>！</span></p>
<p class="MsoNormal"><span>       好了，虽然检测结果是阳性的，但是你没病的可能性还有</span>91%<span>。你会选择不吃肉，每天吃黄连，或者切腿吗？</span></p>
<p class="MsoNormal"><span>       为什么一个阳性率已经相当高（</span>99%<span>）的检测方法，检测出来阳性结果的时候却是</span>91%<span>可能没病呢？仔细看看上面的分析，不难发现：尽管只要有病就几乎肯定（</span>99%<span>）能被检测到，没病被误诊的概率也不高（</span>1%<span>），但是由于发病率很低所以真阳性的数量远远小于假阳性的数量。结果，有病固然基本上显示为阳性，但阳性结果却只有很小的概率是真的有病。</span></p>
<p class="MsoNormal"><span>       现在让我们来玩玩数字游戏，把上面的几个数字改变一下，看看结果会发生什么改变：</span></p>
<p class="MsoNormal"><span><span>       一、<span> </span></span></span><span>保持随机发病率（</span>0.1%<span>）和假阳性率（</span>1%<span>）不变，把阳性率提高到</span>100%<span>，结果阳性结果时的有病概率是</span>9.1%<span>；阳性率降低到</span>90%<span>，阳性结果的有病概率则变为</span>8.3%<span>；如果降低到</span>50%<span>，则结果变为</span>4.8%<span>。也就是说，对于检测结果为阳性的时候得病概率的问题，表示有病情况下被检测出来的准确性（阳性率）并不是那么关键。不过这个数字的影响在于，如果低的话，检测结果阴性但是有病的可能性却还是很高，这个检测也就很成问题。</span></p>
<p class="MsoNormal"><span><span>       二、保</span></span><span>持阳性率（</span>99%<span>）和假阳性率（</span>1%<span>）不变。把发病率改为</span>1%<span>，阳性结果有病的概率就变成了</span>50%<span>；如果把发病率降低到</span>0.01%<span>（万分之一），则即使检测结果为阳性，得病的概率也还不到</span>1%<span>。</span></p>
<p class="MsoNormal"><span><span>       三、<span> </span></span></span><span>保持阳性率</span>99%<span>，发病率</span>0.1%<span>不变，把假阳性率降低到</span>0.1%<span>，会发现阳性结果有病的概率变成了</span>49.8%<span>；如果假阳性率升高到</span>5%<span>，则这个概率只有</span>1.9%<span>。</span></p>
<p class="MsoNormal"><span>       好了，总结上面的数字游戏——游戏只是说随意地改变参数，算法是可靠的——可以看出：当面对一个阳性结果，真实情况如何并不全由阳性率（有病的时候能被检测到的概率）决定。真实的随机发病率和假阳性率的相对大小甚至更为重要。</span></p>
<p class="MsoNormal"><span>       对于地震预测而言，地震相当于得病，我们用来预测地震的方法相当于检测手段，而试图用以预测地震的那些“异象”，蟾蜍过街也罢，猪不进圈也罢，相当于阳性结果。地震预测就是根据那些“阳性结果”去推测地震发生的可能性。</span></p>
<p class="MsoNormal"><span>       现在我们来看看地震预测中的这几个参数。尽管有无数的文章从科学研究的现有结果指出地震与动物“异象”关系不大，但是许多人仅仅出于“信念”而“相信”动物有着神奇之处，在地震来临之前可以感受到并且做出反应。好吧，我们不在这个问题上费口水了，就算可以吧。按照这种“信念”，如果地震要发生，蟾蜍一定会搬家，猪一定会出圈，狗一定会叫个没完。。。把阳性率假设为</span>100%<span>，总不会再有口水了吧。再说地震发生，有意义的预测总得告诉人们在一个不大的地区内不长的时间内有不算低的可能性发生地震，预测“未来十年中国会发生大地震”大概没有什么实际意义。预测到一块不大的区域，比如中国行政区划上的一个地区，在几个月内有地震大概才会有一定的决策意义。想想这样的一个区域在过去几百年中发生了几次地震，可以估算在一定长度的时间段内发生地震的概率。比如</span>500<span>年中发生了</span>5<span>次大地震（这个算得上地震高发区了吧？），那么在任何一个月的时间段内发生地震的概率可以估算为</span>1200<span>分之一。而对于某种动物“异象”，比如蟾蜍过街或者猪不进圈，也可以统计在这</span>500<span>年中发生过多少次，除去发生了地震那几次，剩下的就是假阳性的次数。这个数字大概无法统计，因为没有发生地震的话人们会忽略这种“异象”而不会留下记录。不过，现在的资讯发达，过去几年全国报道过的“蟾蜍过街”不下十起，即使把绵竹的那一起勉强算作“阳性结果”，假阳性率应该还是大大高于地震发生率。这里做个保守估计，算</span>10<span>倍吧，那么假阳性率是</span>120<span>分之一。把这三个数字带入上面的分析，结果：即使地震来临之前蟾蜍一定会过街，当看到蟾蜍过街的时候，地震发生的概率也只有</span>9.1%<span>。</span></p>
<p class="MsoNormal"><span>        这个</span>9.1%<span>，还是基于上面的数字游戏中所有数字都尽可能往有利于预测的方向上靠的结果。实际上有很多地震之前并没有看到蟾蜍过街，也就是说那个</span>100%<span>的阳性率是不靠谱的，其次实际的地震发生率和蟾蜍过街率的差别，很可能也要远远高于</span>10<span>倍。所以，蟾蜍过街这个“阳性结果”，所预示的“得病概率”还会远远低于上面的结果。一个检测结果阳性的人，如果没有作防治，最后得了绝症，人们会说虽然只有百分之几的可能，但是切腿还是比得绝症好多了，当初应该接受“预测”的。但是，当初面对几个百分点的得病概率还没有发病的时候呢？当面对大量既没切腿又没得病的例子的时候呢？</span></p>
<p class="MsoNormal"><span>        许多人又说了，谁让你只看蟾蜍的，多看些动物，假阳性率不就低了么？这话理论上是没错的。问题在于，多看些动物，比如在蟾蜍过街的同时，还要猪不进圈，狗不吃饭，鸡不下蛋。。。如此等等，同时发生来作为“阳性指标”。假阳性率可能是降低了，“真阳性率”却也同时降低了。看看过去发生的地震，有多大的比例同时达到了这些“阳性指标”？“真阳性率”降低了，地震还是不能被预测到。</span></p>
<p class="MsoNormal"><span>        在前面疾病普查的例子中，疾病的随机发生率是</span>0.1%<span>，检测结果是阳性的话虽然得病的概率也不够高，但是上升到了</span>9%<span>。我们再在进行一次独立的检测，如果还是阳性的话，患病的可能性就高达</span>90.7%<span>。当然我们还可以再进行一次，还是阳性的话，得病概率就接近</span>100%<span>了。这也就是许多阳性结果要进行复查的原因。这里强调要“独立进行”，是因为只有复查独立进行，依据的信息跟前一次无关，计算中所用的参数才成立。但是对于地震预测来说，如何进行这样独立的复查？或许有人说可以把蟾蜍过街当作一次，猪不进圈当作一次，甚至狗不跟邻居的母狗搭讪也算作一次。这想法也不是不可以，但是当这样预测的时候，每一种预测中所用的参数都将是别的取值了，没法按照上面的计算过程简单重复了。有兴趣的人当然可以取认为合理的参数，看看这样的“预测”有多靠谱。</span></p>
<p class="MsoNormal"><span>        如果有</span>1%<span>的可能要得绝症，而防治的措施是不吃肉的话，相信很多人可以做到；天天吃黄连，大概也有很多人可以接受；但是切腿呢？</span></p>
<p class="MsoNormal"><span>        即便是我们“相信”地震来临的时候动物会有异常，根据这种“异常”来“预测”地震的可靠性能有多高？相对于地震来临，长时间大面积众多人口的躲避是相当于不吃肉，吃黄连，还是切腿？</span></p>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/216/feed</wfw:commentRss>
		<slash:comments>143</slash:comments>
		</item>
		<item>
		<title>你觉得，什么叫做预测</title>
		<link>http://songshuhui.net/archives/171</link>
		<comments>http://songshuhui.net/archives/171#comments</comments>
		<pubDate>Thu, 15 May 2008 13:32:10 +0000</pubDate>
		<dc:creator>安婆婆</dc:creator>
				<category><![CDATA[专题]]></category>
		<category><![CDATA[专题：地震]]></category>
		<category><![CDATA[数学]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[地震]]></category>
		<category><![CDATA[洛仑兹方程]]></category>
		<category><![CDATA[统计决策]]></category>
		<category><![CDATA[蝴蝶效应]]></category>
		<category><![CDATA[随机事件]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=171</guid>
		<description><![CDATA[一辆车以5米/秒的速度沿直线行驶。1秒以后它距离上一秒所在地有多远？ 足球裁判抛起一个硬币，它落下来的时候是正面还是反面？ 知道了背后的物理原理，我们能做出完全准确的预测吗？ 对于随机的事件，进行预测有意义吗？ 那么，地震呢？ 第一个问题的答案，大家都知道，是5米。第二个问题，答案是我不知道。我知道的是，如果抛很多次，得到正面的次数和得到反面的次数接近1：1。第一类问题，从当前时刻的状态，能精确得出下一时刻的状态，属于决定性事件。第二类问题，永远无法决定下一刻会发生什么，只知道各种结果出现的概率，属于随机性事件。这两类事件共同组成了我们生存的这个世界。牛顿的经典力学公式可以描述地球上宏观物体的运动规律，而赌城老板赚钱的法宝都建立在概率论的基础上。预测一个问题，首先要弄清楚正在研究的是哪类事件。两者的差别这么大，自然也要选择不同的分析方法。 （一） 预测决定性的事件，关键在于找到现象背后隐藏的公式，给出现象随时间变化的规律。比如第一个问题，“一辆车以5米/秒的速度沿直线行驶”，和这句话等价的公式是dx/dt= 5（不喜欢微积分的同学就骂我吧，它表示“走过的距离x随时间t的变化为5”，这样写只是为了更好地理解后面的例子；你可以把左边等价为速度v）。这样小车在任意时刻t所处的位置x都可以用x=5t算出来了。也许我们心里都有那么一小下抽动：为什么要存在随机性事件呀，这个世界都可以用公式来描述该多好！简洁，精确，深入现象的本质，既能描述过去，也能预知未来。 可是先别忙，公式描述的世界有时候会大大出乎我们的意料。比如这一组： x，y，z是表示物体位置的坐标，相当于把上面例子中沿x的一维直线运动推广到三维的空间运动。看起来，这组方程比dx/dt=5稍微复杂了一点。那么它所描述的运动路线是什么样子的呢？如果从(5,20,-10)这一点出发，我在15秒时间内走过的轨迹是下图左边的那条蓝线。看起来形状有点怪哈？可是管它呢，我在任意时刻的位置都被准确记录。比如，可以预测14.45秒我正处在蓝色圆点那里。这有什么不对吗？ 好，换你来走。我们尽可能地从同一个地方出发，但是你稍微站偏了一丁点儿，出发点变成了(5,20,-10.1)。于是根据方程计算，你在15秒内走过的轨迹是中间那条红线，14.45秒的时候正走到红色圆点那里。两个图重合起来，看到了什么？我们的出发点几乎是重合的，结果却相差了这么远！ 这个例子是什么意思呢？设想现实中我们用仪器测量x，y，z。任何仪器都是有误差的。那么在这个例子中，0.1的误差就会导致预测结果的大相径庭。0.1只是我随意设定的一个小值，附录里有这个方程和绘制曲线的matlab程序，你有兴趣的话可以亲自动手验证——从诸如(4.9, 19.5, -10)等等的微小偏移点出发，在14.45秒的时候和蓝色圆点的距离，比起始点的偏差大得多。实际上这种“差之毫厘，失之千里”的现象是这个方程组所描述的运动的特性。也就是著名的“蝴蝶效应”的来由。 举这个例子，是为了说明即使能把一个现象背后的公式全部推导出来，并且把方程都解出来了（这已经很伟大了），并且各个物理量的测量都控制在合理误差范围之内，——我们还是没法作出准确的预测。谢谢写下这组方程的气象学家洛仑玆，他让我们发现决定性的世界并不像想象中那样完美，秩序本身隐藏着混乱，这真是自然跟我们开的一个大玩笑。缅怀他。 （二） 再来看第二类问题。对于随机发生的事件，“预测”的意义在哪里呢？让我们回到足球裁判那里。如果你事先知道这块硬币被人做了手脚，100次落下有85次头像朝上。这时裁判让你先选，你选什么？头像那一面，对不对？虽然这个信息并不能保证这次朝上的一定是头像，但它告诉你头像比数字更有可能，于是你选择了赢的机会更大的一面。 因此，“预测”随机事件，实际上是预测每个可能结果发生的概率，然后人们根据这个信息作出最有利的决策。举个非常简单化的例子吧。比如你租了一间店面，在卖麻辣烫还是卖盒饭之间犹豫。卖麻辣烫成本低，每天100元（随便说的啊，有生活经验的前辈们尽管嘲笑吧）；卖盒饭得请师傅，成本增加了60元。可是在这个地区卖盒饭能够成功经营下去的可能性更大，预计是6成的把握。或者说，麻辣烫失败的可能性是6成，盒饭是4成。那么，卖什么好呢？ 我们综合起来看，卖麻辣烫有60%的可能性损失掉100元的成本费，而卖盒饭有40%的可能性损失掉160元的成本费。那么取概率和成本两者的乘积作为指标，可以得出两种决策的“风险值”：麻辣烫=60%x100=60，盒饭=40%x160=64。用这个指标，卖麻辣烫赔本的风险更小。哈哈，原来光听别人说“卖盒饭好赚钱”就跟风，不一定是明智的举动。 可以看出，在这里预测“风险值”和前文预测决定性的事件是两种不同的思路。它无法指出一个事件的走势，而是在所有可能方案里帮你选择最有机会得利的一个。这样，进行预测的方法就灵活得多，往往要依靠实际经验，很多时候还需要引入合理的假设。比如上面对“风险值”指标的计算就是人为规定的，可以视需要进行修改。这种“人为操作”空间的存在也是专门研究随机事件的统计学会有那么多分枝和争论的原因之一。 （三） 你也许看出我啰里八嗦这么多的目的了。我就是想为地震预测的困难辩护。首先，如果地震的发生原理是完全可以写成公式的，也有可能因为“蝴蝶效应”的存在变得难以预测。我对地震外行，但我至少知道造成地震的原因是多方面的。描述运动汽车的微分方程只需要包含速度和加速度，而且不含有这两个量相乘的项。这样的线性系统中，初始值的微小差距不会随着时间流逝被放大。可是一旦各种因素和作用关系纷繁复杂起来，变量的数目增多，乘积项出现，就形成了所谓的非线性系统。在这样的系统中，出现类似于洛仑兹曲线的性质并不稀罕。洛仑兹的方程来自气象学，另外在生态学、社会学等研究群体效应的领域，也早有人注意到了这种多变量复杂作用导致的“秩序中的混乱”。地球科学的研究对象一点也不比那些学科简单，预测的误差中包含“蝴蝶效应”是极为可能的。 其次，如果地震不能用公式模拟，是一个随机事件，那么即使统计出一个地区发生地震的概率，也要多方面加以考虑，进行科学的风险评估才能做出是否搬迁的决定。这样的评估可不像卖盒饭，对搬迁牵扯到的各种问题要事无巨细地一一预计后果，再把这些量化，然后寻找合适的统计学方法，算出合理的指标来指导决策。计算地震发生的概率本身就是一个难题，即使概率算准了，听说高于百分之五十就大规模动迁，不就像听说盒饭好卖就卖盒饭吗？何况前面已经说了即使有系统的统计理论作指导，仍然存在很大的“人为操作”空间，许多因素需要评经验进行前提假设。这样的决策能不难吗？决策不当带来的社会动荡，经济损失，对老百姓不也是一场灾难吗？ 最后纯属娱乐，也凑热闹说几句蛤蟆。对于靠动物行为反常来预测地震，写出微分方程的可能性不太大。也许比较好的方法还是靠统计，比如蛤蟆过桥和发生地震同时出现的概率是多少。那么，也可以统计狗急跳墙和地震同时出现的概率，鸡急上树和地震同时出现的概率，老鼠搬家和地震同时出现的概率。。。等等等等，几乎每种动物都可以统计一下。好了，我的问题是，这么多个概率值，你信哪一个？还是只要看到某种动物的反常举动，并且对应地震的概率大于百分之五十，就该撒腿儿跑了呢？ 其实把地震现象视作完全的决定性事件或是完全的随机事件都不太合理。最可能的是二者都有。某些原理是可以写成公式的，某些因素的作用则是随机的。那情况就更复杂了。如果谁还想跳出来指着地震局的研究人员责问“你们为什么不预测”，请先答我一个问题：你说的预测，指什么？ 附录： 洛仑兹方程及绘制曲线的MATLAB程序 [T1,Y1] = ode23('lorfun',[0 15],[5 20 -10]); [T2,Y2] = ode23('lorfun',[0 15],[5 20 -10.1]); plot3(Y1(:,1),Y1(:,2),Y1(:,3),'b');plot3(Y1(500,1),Y1(500,2),Y1(500,3),'o','MarkerSize',12, 'MarkerFaceColor','b'); hold on; plot3(Y2(:,1),Y2(:,2),Y2(:,3),'r');plot3(Y2(533,1),Y2(533,2),Y2(533,3),'or','MarkerSize',12, 'MarkerFaceColor','r'); function f = lorfun(t,s) % Lorenz attractor sigma = [...]]]></description>
			<content:encoded><![CDATA[<p>本文作者：安婆婆</p>
<p>一辆车以5米/秒的速度沿直线行驶。1秒以后它距离上一秒所在地有多远？<br />
足球裁判抛起一个硬币，它落下来的时候是正面还是反面？<br />
知道了背后的物理原理，我们能做出完全准确的预测吗？<br />
对于随机的事件，进行预测有意义吗？<br />
那么，地震呢？</p>
<p>第一个问题的答案，大家都知道，是5米。第二个问题，答案是我不知道。我知道的是，如果抛很多次，得到正面的次数和得到反面的次数接近1：1。第一类问题，从当前时刻的状态，能精确得出下一时刻的状态，属于决定性事件。第二类问题，永远无法决定下一刻会发生什么，只知道各种结果出现的概率，属于随机性事件。这两类事件共同组成了我们生存的这个世界。牛顿的经典力学公式可以描述地球上宏观物体的运动规律，而赌城老板赚钱的法宝都建立在概率论的基础上。预测一个问题，首先要弄清楚正在研究的是哪类事件。两者的差别这么大，自然也要选择不同的分析方法。<br />
<span id="more-171"></span><br />
                                         （一）<br />
预测决定性的事件，关键在于找到现象背后隐藏的公式，给出现象随时间变化的规律。比如第一个问题，“一辆车以5米/秒的速度沿直线行驶”，和这句话等价的公式是dx/dt= 5（不喜欢微积分的同学就骂我吧，它表示“走过的距离x随时间t的变化为5”，这样写只是为了更好地理解后面的例子；你可以把左边等价为速度v）。这样小车在任意时刻t所处的位置x都可以用x=5t算出来了。也许我们心里都有那么一小下抽动：为什么要存在随机性事件呀，这个世界都可以用公式来描述该多好！简洁，精确，深入现象的本质，既能描述过去，也能预知未来。</p>
<p>可是先别忙，公式描述的世界有时候会大大出乎我们的意料。比如这一组：<br />
<a href='http://songshuhui.net/wp-content/uploads/2008/05/lorenz_eq.jpg'><img src="http://songshuhui.net/wp-content/uploads/2008/05/lorenz_eq.jpg" alt="" width="273" height="171" class="alignnone size-full wp-image-172" /></a></p>
<p>x，y，z是表示物体位置的坐标，相当于把上面例子中沿x的一维直线运动推广到三维的空间运动。看起来，这组方程比dx/dt=5稍微复杂了一点。那么它所描述的运动路线是什么样子的呢？如果从(5,20,-10)这一点出发，我在15秒时间内走过的轨迹是下图左边的那条蓝线。看起来形状有点怪哈？可是管它呢，我在任意时刻的位置都被准确记录。比如，可以预测14.45秒我正处在蓝色圆点那里。这有什么不对吗？ 好，换你来走。我们尽可能地从同一个地方出发，但是你稍微站偏了一丁点儿，出发点变成了(5,20,-10.1)。于是根据方程计算，你在15秒内走过的轨迹是中间那条红线，14.45秒的时候正走到红色圆点那里。两个图重合起来，看到了什么？我们的出发点几乎是重合的，结果却相差了这么远！<br />
<a href='http://songshuhui.net/wp-content/uploads/2008/05/lorattr1.bmp'><img src="http://songshuhui.net/wp-content/uploads/2008/05/lorattr1.bmp" alt="" class="alignnone size-medium wp-image-174" /></a></p>
<p>这个例子是什么意思呢？设想现实中我们用仪器测量x，y，z。任何仪器都是有误差的。那么在这个例子中，0.1的误差就会导致预测结果的大相径庭。0.1只是我随意设定的一个小值，附录里有这个方程和绘制曲线的matlab程序，你有兴趣的话可以亲自动手验证——从诸如(4.9, 19.5, -10)等等的微小偏移点出发，在14.45秒的时候和蓝色圆点的距离，比起始点的偏差大得多。实际上这种“差之毫厘，失之千里”的现象是这个方程组所描述的运动的特性。也就是著名的“蝴蝶效应”的来由。</p>
<p>举这个例子，是为了说明即使能把一个现象背后的公式全部推导出来，并且把方程都解出来了（这已经很伟大了），并且各个物理量的测量都控制在合理误差范围之内，——我们还是没法作出准确的预测。谢谢写下这组方程的气象学家洛仑玆，他让我们发现决定性的世界并不像想象中那样完美，秩序本身隐藏着混乱，这真是自然跟我们开的一个大玩笑。缅怀他。
</p>
<p>                                              （二）<br />
再来看第二类问题。对于随机发生的事件，“预测”的意义在哪里呢？让我们回到足球裁判那里。如果你事先知道这块硬币被人做了手脚，100次落下有85次头像朝上。这时裁判让你先选，你选什么？头像那一面，对不对？虽然这个信息并不能保证这次朝上的一定是头像，但它告诉你头像比数字更有可能，于是你选择了赢的机会更大的一面。</p>
<p>因此，“预测”随机事件，实际上是预测每个可能结果发生的概率，然后人们根据这个信息作出最有利的决策。举个非常简单化的例子吧。比如你租了一间店面，在卖麻辣烫还是卖盒饭之间犹豫。卖麻辣烫成本低，每天100元（随便说的啊，有生活经验的前辈们尽管嘲笑吧）；卖盒饭得请师傅，成本增加了60元。可是在这个地区卖盒饭能够成功经营下去的可能性更大，预计是6成的把握。或者说，麻辣烫失败的可能性是6成，盒饭是4成。那么，卖什么好呢？</p>
<p>我们综合起来看，卖麻辣烫有60%的可能性损失掉100元的成本费，而卖盒饭有40%的可能性损失掉160元的成本费。那么取概率和成本两者的乘积作为指标，可以得出两种决策的“风险值”：麻辣烫=60%x100=60，盒饭=40%x160=64。用这个指标，卖麻辣烫赔本的风险更小。哈哈，原来光听别人说“卖盒饭好赚钱”就跟风，不一定是明智的举动。</p>
<p>可以看出，在这里预测“风险值”和前文预测决定性的事件是两种不同的思路。它无法指出一个事件的走势，而是在所有可能方案里帮你选择最有机会得利的一个。这样，进行预测的方法就灵活得多，往往要依靠实际经验，很多时候还需要引入合理的假设。比如上面对“风险值”指标的计算就是人为规定的，可以视需要进行修改。这种“人为操作”空间的存在也是专门研究随机事件的统计学会有那么多分枝和争论的原因之一。</p>
<p>                                                  （三）<br />
你也许看出我啰里八嗦这么多的目的了。我就是想为地震预测的困难辩护。首先，如果地震的发生原理是完全可以写成公式的，也有可能因为“蝴蝶效应”的存在变得难以预测。我对地震外行，但我至少知道造成地震的原因是多方面的。描述运动汽车的微分方程只需要包含速度和加速度，而且不含有这两个量相乘的项。这样的线性系统中，初始值的微小差距不会随着时间流逝被放大。可是一旦各种因素和作用关系纷繁复杂起来，变量的数目增多，乘积项出现，就形成了所谓的非线性系统。在这样的系统中，出现类似于洛仑兹曲线的性质并不稀罕。洛仑兹的方程来自气象学，另外在生态学、社会学等研究群体效应的领域，也早有人注意到了这种多变量复杂作用导致的“秩序中的混乱”。地球科学的研究对象一点也不比那些学科简单，预测的误差中包含“蝴蝶效应”是极为可能的。</p>
<p>其次，如果地震不能用公式模拟，是一个随机事件，那么即使统计出一个地区发生地震的概率，也要多方面加以考虑，进行科学的风险评估才能做出是否搬迁的决定。这样的评估可不像卖盒饭，对搬迁牵扯到的各种问题要事无巨细地一一预计后果，再把这些量化，然后寻找合适的统计学方法，算出合理的指标来指导决策。计算地震发生的概率本身就是一个难题，即使概率算准了，听说高于百分之五十就大规模动迁，不就像听说盒饭好卖就卖盒饭吗？何况前面已经说了即使有系统的统计理论作指导，仍然存在很大的“人为操作”空间，许多因素需要评经验进行前提假设。这样的决策能不难吗？决策不当带来的社会动荡，经济损失，对老百姓不也是一场灾难吗？</p>
<p>最后纯属娱乐，也凑热闹说几句蛤蟆。对于靠动物行为反常来预测地震，写出微分方程的可能性不太大。也许比较好的方法还是靠统计，比如蛤蟆过桥和发生地震同时出现的概率是多少。那么，也可以统计狗急跳墙和地震同时出现的概率，鸡急上树和地震同时出现的概率，老鼠搬家和地震同时出现的概率。。。等等等等，几乎每种动物都可以统计一下。好了，我的问题是，这么多个概率值，你信哪一个？还是只要看到某种动物的反常举动，并且对应地震的概率大于百分之五十，就该撒腿儿跑了呢？</p>
<p>其实把地震现象视作完全的决定性事件或是完全的随机事件都不太合理。最可能的是二者都有。某些原理是可以写成公式的，某些因素的作用则是随机的。那情况就更复杂了。如果谁还想跳出来指着地震局的研究人员责问“你们为什么不预测”，请先答我一个问题：你说的预测，指什么？</p>
<p>附录：<br />
洛仑兹方程及绘制曲线的MATLAB程序</p>
<p>[T1,Y1] = ode23('lorfun',[0 15],[5 20 -10]);<br />
[T2,Y2] = ode23('lorfun',[0 15],[5 20 -10.1]);</p>
<p>plot3(Y1(:,1),Y1(:,2),Y1(:,3),'b');plot3(Y1(500,1),Y1(500,2),Y1(500,3),'o','MarkerSize',12, 'MarkerFaceColor','b');<br />
hold on; plot3(Y2(:,1),Y2(:,2),Y2(:,3),'r');plot3(Y2(533,1),Y2(533,2),Y2(533,3),'or','MarkerSize',12, 'MarkerFaceColor','r');</p>
<p>function f = lorfun(t,s)<br />
% Lorenz attractor</p>
<p>sigma = 10;<br />
rho = 28;<br />
beta = 8/3;</p>
<p>x = s(1,1);<br />
y = s(2,1);<br />
z = s(3,1);<br />
f(1,1) = -beta*x + y*z;<br />
f(2,1) = sigma*(z-y);<br />
f(3,1) = -x*y + rho*y - z;</p>
<p>以及两个曲线增长过程的动画：</p>
<ul>http://www.wam.umd.edu/~petersd/lorenz.html</ul>
<ul>http://www.sat.t.u-tokyo.ac.jp/~hideyuki/java/Attract.html</ul>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/171/feed</wfw:commentRss>
		<slash:comments>106</slash:comments>
		</item>
	</channel>
</rss>

