<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>科学松鼠会 &#187; 方弦</title>
	<atom:link href="http://songshuhui.net/archives/author/fwjmath/feed" rel="self" type="application/rss+xml" />
	<link>http://songshuhui.net</link>
	<description>让我们来剥开科学的坚果</description>
	<lastBuildDate>Fri, 10 Feb 2012 06:28:27 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>[孤独专题]有限单群：一段百年征程</title>
		<link>http://songshuhui.net/archives/57697</link>
		<comments>http://songshuhui.net/archives/57697#comments</comments>
		<pubDate>Sun, 07 Aug 2011 02:29:38 +0000</pubDate>
		<dc:creator>方弦</dc:creator>
				<category><![CDATA[专题：孤独]]></category>
		<category><![CDATA[数学]]></category>
		<category><![CDATA[伽罗华]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[孤独]]></category>
		<category><![CDATA[有限单群]]></category>
		<category><![CDATA[群论]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=57697</guid>
		<description><![CDATA[1832年的某个清晨，革命中的法国见证了又一次决斗。在某个瞬间，某位青年被对手的枪射中腹部，随后去世。在当时狂热的政治斗争中，只有寥寥数人意识到，法国，甚至世界，又失去了另一个伟大的头脑。这位青年姓伽罗华，他的最大遗产围绕着一个数学概念：群。 ]]></description>
			<content:encoded><![CDATA[<p>本文作者：方弦</p>
<p>1832年的某个清晨，革命中的法国见证了又一次决斗。在某个瞬间，某位青年被对手的枪射中腹部，随后去世。在当时狂热的政治斗争中，只有寥寥数人意识到，法国，甚至世界，又失去了另一个伟大的头脑。这位青年姓伽罗华，他的最大遗产围绕着一个数学概念：群。</p>
<p>在接下来的一百多年后，一群在世界各地的数学家，沿着这位青年开辟的路径，对有限群的结构进行了彻底的分析。其中的发现，可能出乎所有人的意料。</p>
<p>这是一个关于群的故事，这是一个关于单群的故事。</p>
<h1>高度抽象的对称</h1>
<div class="wp-caption alignnone" style="width: 306px"><img src="http://songshuhui.net/forum/attachments/month_1106/1106022321f81e62a6eb4c5cb0.png" alt="交错群A_5的一个Cayley图（一种群的图示）" width="296" height="300" /><p class="wp-caption-text">交错群A_5的一个Cayley图（一种群的图示）</p></div>
<p>什么是群？一个数学家可能会给你这样的回答：</p>
<p>一个群是一个集合G以及在G上的一个运算·，满足以下三个条件：<br />
1. 存在一个G中的元素e，使得对于G中的任意元素x，有x=x·e=e·x。这样的e叫做群的单位元<br />
2. 对于G中的任意元素x,y,z，有(x·y)·z=x·(y·z)，这是结合律<br />
3. 对于G中的任意元素x，存在G中的一个元素y，使得e=x·y=y·x。这样的y被称为x的逆元</p>
<p>这样的定义，即使是对一名刚进大学的数学系学生来说也稍显抽象。但数学的力量就在于它的抽象。它什么都不是，所以它什么都是。</p>
<p>整数和加法就构成一个群。什么数加上0都不变，所以0是单位元；a+(b+c)=(a+b)+c，这是小学的加法结合律；一个数加上它的相反数是单位元0，所以相反数就是逆元。正实数和乘法也构成一个群，1是它的单位元，乘法有结合律，倒数是逆元。如果我们认为9点+5点相当于9点的5个小时后，也就是2点的话，就连时钟也构成一个群。宝石的晶体构造，电脑的压缩校验算法，以至于魔方的还原，无不牵涉“群”这个概念。而对于自然界的各种对称性，群也是对其最自然的描述方式。难怪有人会说，群就是对称，研究群，就是研究各种对称性。</p>
<p>正是由于放弃了与现实的对应，像群这样的抽象数学概念才能在现实中获得广泛的对应。我们研究群，并不关心它的具体元素是什么，是x,y,z还是姬十三、猛犸、桔子都无所谓，只要知道元素通过运算产生的关系就够了，这就是群的全部。只要符合群的公理，能应用到x,y,z上的结论就能应用到姬十三、猛犸、桔子上，这就是抽象的力量。</p>
<h1>超越时代的孤独</h1>
<p>&nbsp;</p>
<div class="wp-caption alignnone" style="width: 207px"><img src="http://songshuhui.net/forum/attachments/month_1106/11060223216625cc04235ff9ee.jpg" alt="伽罗华的画像" width="197" height="255" /><p class="wp-caption-text">伽罗华的画像</p></div>
<p>也正由于这种抽象，群的概念在一开始并没有很快地被接受。</p>
<p>伽罗华是在研究一元五次方程的根式解时开始触及群的概念的。对于一元二次方程来说，我们可以将方程的所有解写成有关方程系数的一个根式（允许四则运算和开常数次方运算组成的式子），这称为方程的根式解。对于三次以及四次方程，也有这样的公式，可以直接从方程的系数得到方程的所有解。然而，对于五次以及更高次的方程来说，此前阿贝尔已经证明一般的公式并不存在。伽罗华要解决的，是判断何时存在这样的根式表达。</p>
<p>为了解决这个问题，他首次定义了群这种代数结构，仔细地研究了群的各种性质，以及它与更高级的一种代数结构——域——的关系，并以此发展了一套理论，完整地解决了这个问题。他写下了关于这套理论与高次方程根式解的备忘录，并将其递交到法兰西科学院。</p>
<p>他的不幸从此开始。</p>
<p>这份备忘录的评审人是柯西。虽然认识到了伽罗华工作的重要性，柯西却没有接受这份备忘录，而是建议伽罗华修改这份备忘录以竞逐科学院的数学奖。</p>
<p>伽罗华接受了这个建议，第二次提交了备忘录。</p>
<p>天意弄人，评审人傅里叶之后不久就逝世了，伽罗华的备忘录不知所踪。</p>
<p>伽罗华决定最后一搏，但这也被泊松驳回，理由是“无法理解”。当消息传到伽罗华耳中时，他早已因为政治斗争而身陷囹圄，此时离他的决斗只有半年时间。</p>
<p>没有人理解他的理论，或者说没有人愿意去理解他的理论。</p>
<p>就是这套理论，使伽罗华的名声流芳百世。尽管他无法发表他的备忘录，但他此前发表的论文讲述了这个理论的一些基础。泊松的驳回理由，使他更认真地打磨他的理论，以冀数学界的认同。</p>
<p>但死神的镰刀没有给他这个时间，上天不打算给他安排生前的荣耀。1832年5月30日，年方二十的伽罗华，迎来了他第一次也是最后一次的决斗。这场决斗的细节已经被时间之砂打磨掩盖，什么对手，什么原因，有人说是为了爱情，有人说对手背后有政治阴谋，众家各执一词。我们只知道，在这场决斗中，伽罗华腹部中枪，不久后魂归天国。</p>
<p>“不要哭，阿尔弗雷德！在二十岁死去，我需要我的全部勇气。”这就是他对弟弟说的最后一句话。</p>
<p>而决斗前夕给他的朋友Chevalier的信，可以算是他对世界的遗言。信中密密麻麻地写着他的数学理论，他正在思考的问题，他脑中的一切。他大概冀图某天，世界能够通过这封信，理解他。</p>
<p>幸而，Chevalier实现了他挚友的意愿。伽罗华的理论，现在以他的名字命名：伽罗华理论。</p>
<p>也就是这封信，吹响了一场百年战役的号角。</p>
<h1>构筑对称的砖块</h1>
<div class="wp-caption alignnone" style="width: 311px"><img src="http://songshuhui.net/forum/attachments/month_1106/110602232118e14fb20836a704.png" alt="Z/6Z的一个Cayley图，其中可以看出它可分解为两个单群" width="301" height="216" /><p class="wp-caption-text">Z/6Z的一个Cayley图，其中可以看出它可分解为两个单群</p></div>
<p>在伽罗华理论，乃至于更广泛的群的理论中，有一个很重要的概念：正规子群。</p>
<p>我们以下只讨论那些只有有限个元素的群，它们被称为有限群。例如，魔方操作组成的群就是有限群，因为变化的可能性是有限的。而整数与加法组成的群则不是有限群，因为整数有无限个。</p>
<p>在一个群里，有些元素自己会组成一个小圈子。它们并非不与外界交流，但无疑它们喜欢抱团：小圈子内的元素经过运算得到的结果仍然在这个小圈子里，而它们的逆元也在小圈子里。简而言之，这个小圈子对于原来的运算也组成一个群。这样的小圈子，叫做群的子群。</p>
<p>有些子群比别的子群更特别，它们不仅自己是一个群，如果“除”原来的群，得到的也是一个群。这样的子群叫做正规子群，而它们对原来的群作“除法”得到的群叫商群。首先观察到并提出正规子群这个概念的，正是伽罗华。</p>
<p>通过研究更简单的正规子群和商群，我们可以得到群的很多性质。这就是数学家特别钟爱正规子群的原因。</p>
<p>如果我们将正规子群和商群看成群的一种分解的话，那么必定有着不能被继续分解的群，我们将之称为单群。</p>
<p>对于任意的有限群，我们可以将其分解成一串单群，而且这样的分解是唯一的。单群在有限群论中的地位，跟素数在数论中的地位，还有原子在化学中的地位一样：它们都是构建它们所在世界的砖块。通过研究这些“砖块”，我们可以知道它们组成的各种结构的性质。如果能列出所有有限单群，就能从一个侧面了解所有离散的对称性的性质。</p>
<p>有限单群就是这个故事的主角。</p>
<p>与化学家当年寻找新元素的动机一样，数学家也开始了对有限单群的寻找。他们想做的跟化学家做的差不多：列一个单群的“元素周期表”。不过数学家要做的任务多了一项：证明这个“周期表”包含了所有的单群。</p>
<p>这看起来不太容易，事实正是如此。</p>
<h1>转眼百年的长征</h1>
<div class="wp-caption alignnone" style="width: 610px"><img src="http://songshuhui.net/forum/attachments/month_1106/110602232176ade121d65954b1.jpg" alt="Higman-Sims图，可导出散在单群Higman-Sims群" width="600" height="600" /><p class="wp-caption-text">Higman-Sims图，可导出散在单群Higman-Sims群</p></div>
<p>伽罗华是寻找有限单群当之无愧的第一人。是他首先发现所谓的交错群A_n对于所有n&gt;=5都是单群，从而不是可解群。正是从这个结果出发，他证明了高于五次的方程一般而言没有根式解。而数学家此前对数论的研究也容易导出另一族的单群：素数阶的循环群Z_p。它们也是唯一的交换单群，也就是说运算满足交换律（a·b = b·a）的单群。</p>
<p>无需太纠结为何这些群取这样的名字。对于数学家而言，群就像是宠物，给宠物取的名字可能反映了宠物的性格，也可能是纯粹的趣味。但名字毕竟只是名字，只是称呼这些群的一种方式而已。</p>
<p>像这样整个家族出现的单群，还有16族所谓的有限李群，它们可以看作离散域上的矩阵组成的群。对它们的系统化研究是由挪威数学家Sophus Lie开始的，所以后人以此命名。而其中首先被发现的是所谓的射影特殊线性群PSL_n(q)，其中q是一个素数的幂。在伽罗华生命最后的那封信上，就已经提到PSL_2(p)对于大于3的素数p是单群。后来Chevalley对其进行了更深入的研究，将其推广到一般的素数的幂。对于其余的15族有限李群，Chevalley也功不可没。</p>
<p>除了这一共18个有限单群家族之外，还有26个单独存在的有限单群。它们不属于任何一个家族，而它们之间也没有一个统一的联系，三三两两各自放浪于数学天地之间。数学家给他们起了个相当适合的名字：散在单群。它们是单群中自成一派的例外。成家族出现的单群结构总是相似的，而散在单群却各有各的美丽。</p>
<p>同时进行的则是证明这就是所有的有限单群，这就是所谓的有限单群分类定理。如果将寻找单群比作在森林里抓兔子的话，有限单群分类定理的证明则是确保森林里所有的兔子都被抓光了。这就要求数学家对森林的地形——也就是有限群的结构——有一定的了解。</p>
<p>从某种意义上，整个证明可以追溯到1872年的Sylow定理。这个定理不仅使数学家开始明白有限群更深层的结构，也为后来对各种群的分类讨论提供了武器。而真正明确提出对有限单群分类的，则是1892年的Hölder。他同时也证明了，每一个非交换有限单群的元素个数，是至少四个素数的乘积。</p>
<p>从此开始便是百年的征程，对数学家更不利的一面是，出发的时候还不知道森林里有多少兔子要抓。事实上，分类定理的证明和对有限单群的寻找，很大程度上是交错叠积的。有时是证明的途中，忽然找到了又一个新的有限单群；有时是对于已有的单群的研究启发了证明。这也是可以理解的，毕竟这是研究同一件事物的两条路径。</p>
<p>所以，当1983年Gorenstein宣称有限单群分类定理被证明之时，群论学界可是欢呼雀跃。整个证明散落在各期刊的500多篇论文之中，合计过万页，每篇论文都对某种特殊情况进行了处理。将这些特殊情况合起来，覆盖了绝大多数的有限群类别，而Gorenstein认为，他的新论文恰好补上了仍未处理的那些有限群，从而完成了整个分类定理的证明。</p>
<p>问题是，他弄错了。他以为一类名为“拟薄群”（quasi-thin group）的类别已经被处理好了，但事实上没有。直到2004年，由Aschbacher和Smith撰写的一篇一千多页的论文才将这个情况完全处理妥当，从而填补了这个漏洞。此时，有限单群分类定理，这个有限群理论的圣杯，才正式被圆满证明。</p>
<p>18个有限单群家族，再加上26个散在单群，这就是所有的有限单群。从伽罗华开始历时一个多世纪，跨越两次世界大战的搜索，随着1976年最后一个散在单群被发现，2004年有限单群分类定理的最终证明，这场数学家和有限单群之间的捉迷藏游戏才告结束。这个列表，包含着数代数学家辛勤的汗水，大概还有不少的咖啡、粉笔、墨水和纸。</p>
<p>故事仍未结束。在所有有限单群中，那些散在单群特别令人在意。成它们的出现看似无章可循，没有什么必然的规律。但是，尽管有着“散在单群”这个名字，它们并非与世隔绝之徒。最有名的例子，莫过于那个最大的散在单群——魔群（Monster Group）。</p>
<h1>意料之外的联系</h1>
<p>魔群是在1973年被Fischer和Griess分别独立发现的。虽然它是最大的散在单群，但它并不是最后一个被发现的。实际上，“魔群”这个名字就源于它庞大的体积。魔群的准确元素个数是808017424794512875886459904961710757005754368000000000，也就是大概8*10^53个。与之相比，太阳系的原子个数也就是大约10^57个，仅仅高了两个数量级。如果我们用线性空间和矩阵变换来表示魔群的话，我们至少需要一个196883维的线性空间，才能忠实表达魔群的整体结构。这种表达方式又被称为群的线性表示。</p>
<p>也正是由于魔群如此庞大，所以一开始数学家们并没有直接将它构造出来，而只能指出它的存在性。发现魔群的Griess，也要几个月后，才最终把魔群的元素个数计算出来。而魔群的直接构造，要等到9年后的1982年。那年，Griess提出了一个名为Griess代数的代数结构，而魔群恰好就是这个代数结构的自同构群。换句话说，魔群恰好刻画了Griess代数的所有对称性。值得一提的是，Griess代数的维度是196884，比196883多1。</p>
<p>如果说每一族单群和每一个散在单群代表一种对称性的话，那么魔群一定有着非同寻常的对称性。体积如此庞大的群，却仍然是一个不可分解的单群，这本来就是个奇迹；而且与那些成系列的量产型单群不同，它的结构和对称性还是独一无二的。用个物理上不太恰当的比喻，如果第二大的散在单群是一颗无暇的钻石的话，按照比例，魔群大概就是一颗完全由钻石组成的星球，而且透明得能从一边看到另一边的星空。</p>
<p>如果说如此瑰丽的魔群，仅仅是数学中的一个与世隔绝的孤岛的话，那数学之神未免太浪费了。</p>
<p>而此时，在数学的另一个领域——数论，另一群数学家正在研究一些完全不同的东西。</p>
<p>模形式理论是数论的一个分支，它研究的正是模形式。模形式是复平面上满足一定性质的函数，它们跟一类叫“椭圆曲线”的数学对象密切相关。椭圆曲线是平面上的一类曲线，它经过的整点有一种自然的群的结构，而对这些群的结构的研究可以获得整数的很多性质，包括轰动一时的费马大定理的证明。</p>
<p>在模形式理论中，有一个特殊的函数占据着相当重要的地位，它叫j不变量。它的历史也不短，各种性质已经被数学家们研究得相当透彻了，也为模形式理论的发展立下过汗马功劳。它可以干净利落地展开成如下的傅立叶级数，其中每个系数都是整数：</p>
<p><img src="http://songshuhui.net/forum/attachments/month_1106/1106022321916eeedc6a6d7d21.png" alt="moonshine.png" width="600" /></p>
<p>其中是不是有个数字很眼熟？对，就是第二个傅立叶系数196884，正好是Griess代数的维数，也就是魔群的最小忠实线性表示的维数加1。这仅仅是个巧合，还是有某种内在的联系？</p>
<p>当John McKay在上个世纪七十年代末将这个发现告诉Conway时（顺带一提，这位就是发明“生命游戏”的那个Conway），他们并不认为这是一个单纯的巧合。如果是3或者5这种小数字，那巧合或许还能解释，但196884的话，说是巧合未免过于牵强，“有某种尚未发现的内在联系”这个解释听起来更加合理。Conway和另一位数学家Norton随后发现，j不变量的其它傅立叶系数也与魔群的所谓不可约表示的维数有着紧密的联系：这些傅立叶系数恰好可以表示成不可约表示维数的一些简单的线性组合。这就远远不是巧合能够解释的问题了。</p>
<p>在这些基础上，Conway和Norton提出了他们的所谓“魔群月光猜想”。他们猜想，存在一个基于魔群的无限维代数结构，通过魔群的不可约线性表示，它恰好给出了j不变量的所有傅立叶系数，而魔群每一个元素在这个代数结构上的作用，都自然地给出了与某个群相关的模形式。这其中牵涉到的数学，即使笔者也无从驾驭，需要长时间的学习，方能领会个中美妙滋味。</p>
<p>“魔群月光”这个名字，奇怪地带着些浪漫色彩，但这不过是错觉。“月光”的原文是“moonshine”，在俚语中的意思毫不浪漫，反而是用作形容那些带点疯狂的主意。这就是当时Conway听到这个巧合之时的反应。即使对于最有想象力的数学家来说，要承认数论中被研究得相当透彻的j不变量，与有限群论这个不太相关的领域中新发现的魔群有着这么紧密的联系，这个主意也未免有些疯狂。</p>
<p>但更疯狂的还在后头。</p>
<p>不久，数学家们构造出了一个被称为魔群模（Monster Module）的特殊代数结构，被认为极有可能是满足魔群月光猜想的那个代数结构。要构造这个代数结构，首先要从一个名为Leech格的代数结构开始（顺带一提，这个代数结构有着特殊的对称性，可以构造出数个散在单群），构造一个24维的环面。在这个环面上的玻色弦理论，通过共形场论中的顶点算子来表达，就是魔群模。换句话说，联系着有限群论中的魔群与数论中的j不变量的魔群模，实际上是一个高维空间中的弦理论，表达的是某个高维空间中的可能的物理理论。</p>
<p>数学的两个不同分支，居然通过理论物理被联系了起来。</p>
<p>接下来的事情，就是证明魔群模的确满足了魔群月光猜想。这项工作在1992年由Brocherds完成，证明同时包含了数学和物理，其中用到了弦论中的No-ghost定理来构造证明中必不可少的一个代数结构，Brocherds也由于这个证明获得了菲尔兹奖。通过这个定理架起的桥梁，数学家们也发现了魔群、模函数和弦理论之间更多的千丝万缕的联系。甚至有人过于疯狂地设想，魔群也许就代表着我们这个宇宙终极的对称性。</p>
<p>如果伽罗华仍然在世的话，会对这种柏拉图式的设想有什么看法呢？不过毫无疑问的是，他一定会赞叹他的后继者在他之后，在他铺设的地基上建起的这些晶莹无暇的数学理论。</p>
<h1>不应重现的叹息</h1>
<p>有限单群分类定理是有限群理论的一块里程碑，标志了我们对所有有限对称性的系统理解的开端。对于魔群的研究，也引发了数学家对散在单群的兴趣。关于有限单群的各种研究，至今方兴未艾。</p>
<p>在这个关于单群的故事中，最值得关注的就是整个故事的起点，也就是伽罗华。他的研究奠定了整个有限单群研究的基础。超越时代的他，活着的时候是个孤独的研究者，但现在，谁谈到群论又能绕过他呢？</p>
<p>在数学的天空中，伽罗华宛如一颗匆匆划过的璀璨流星。他的身体太单薄，无法承受时代的狂风；但他发出的光芒，照亮了整个天空，被不同的人以不同的形式记录下来，并将长久不息。以他的名字命名的各种数学概念，已经产生了深远的影响。这使人不禁思考：如果没有那场决斗，他将会做出多大的成就呢？然而，历史没有假设。</p>
<p>这使人不禁想起同为法国人的化学家拉瓦锡的遭遇。在拉瓦锡被构陷上断头台后，数学家拉格朗日的叹息是：“砍下这颗头颅只需一瞬，但百年的等待可能仍不足以使其重现。”一根有智慧的芦苇，需要整个社会长期的积淀产生的土壤，方能破土而出。但芦苇总归是芦苇，命运无常，须臾即可毁去；即便是它脚下的土壤，赤炎燎原，十年亦成焦土。伽罗华的悲剧，现在还在很多地方，以不同的形式，或明或暗地上演着。</p>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/57697/feed</wfw:commentRss>
		<slash:comments>99</slash:comments>
		</item>
		<item>
		<title>明天的智能交通</title>
		<link>http://songshuhui.net/archives/57461</link>
		<comments>http://songshuhui.net/archives/57461#comments</comments>
		<pubDate>Wed, 27 Jul 2011 06:00:27 +0000</pubDate>
		<dc:creator>方弦</dc:creator>
				<category><![CDATA[物理]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[绿波]]></category>
		<category><![CDATA[自适应巡航控制]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=57461</guid>
		<description><![CDATA[城市是一头巨兽，而在城市中穿行的交通工具就组成了它的血液。小汽车、公交、地铁、火车，它们将人和货物从城市的一个地方运到另一个地方，保障城市的正常运作。道路就是城市的命脉。血管堵塞对人来说足以致命，道路堵塞对城市来说则会造成重大损失。]]></description>
			<content:encoded><![CDATA[<p>本文作者：方弦</p>
<p>城市是一头巨兽，而在城市中穿行的交通工具就组成了它的血液。小汽车、公交、地铁、火车，它们将人和货物从城市的一个地方运到另一个地方，保障城市的正常运作。道路就是城市的命脉。血管堵塞对人来说足以致命，道路堵塞对城市来说则会造成重大损失。所以，保持血脉的畅通，是维持城市正常运作的重要一环。但在北京上海这样的巨型城市中，大型的雪崩式的堵塞却常常发生。有没有什么办法可以减少这种堵塞呢？</p>
<h1>柏油路上的绿波</h1>
<p>有一种叫“绿波”的交通模式，可以部分地解决这个问题。</p>
<p>这种现象，可能经常开车的有车一族不太留意，但是在所有十字路口都可以很容易观察到这种现象。路面上不断有车开来，但在路口处如果遇到红灯的话，那就只能停下来。在亮红灯的这段时间，信号灯下就停了一大堆车。红灯刚转为绿灯的时候，这一大波车就都开动起来，这时经过信号灯的车特别多。等到过了一段时间，原来在停着的车都开走之后，经过信号灯的车相对来说就变得很少。这就形成了路面车辆的一种模式：有一段车流相对密集，紧随着一段车流相对稀疏。这种忽高忽低的交通模式，跟水波非常相似。</p>
<p><img class="aligncenter size-full wp-image-57462" src="http://songshuhui.net/wp-content/uploads/2011/07/crossing.png" alt="" width="510" height="269" /></p>
<p>那么，信号灯的策略也很明显了。在车流高峰到达的时候，应该给它们大开绿灯，让占车流大部分的车过去；而车流低谷的时候，正好利用这段时间让行人和另外方向的车穿过十字路口。这样创造出来的效果，就是所谓的“绿波”，因为每一个车流高峰都会遇到绿灯，一路畅通。拉斯维加斯的“人人VIP待遇”就是利用的这个原理。</p>
<p>这种“绿波”的设置，还有助于控制车速。开得太快的车，会先于车流高峰到达信号灯，这时遇到红灯的它就只能停下，等待高峰到了再一起走，无形中减慢了速度。开得太慢的车，会落后于车流高峰到达信号灯，这时它也会遇到红灯，只能等着跟下一波高峰一起走，相对地也提醒司机：你丫开得太慢了！这样就能将总体的车速调节到一个相对合适的范围。</p>
<h1>绿波有多远？</h1>
<p>不过，要实现这种技术，还是有几个问题需要解决的。</p>
<p>首先是怎么判断车流高峰到没到。尽管在高峰时车流相对比较集中，但每辆车的速度不同，这个高峰也会越变越稀疏，难以判断具体位置。解决这个问题的方法也不难。一个方面，我们可以假定车流高峰在绿灯的时候经过前一个路口，那么要让高峰经过这个路口时也遇上绿灯，只需要计算高峰经过两个路口的距离需要多长时间。打好时间差就可以了。我们可以估算一个合适的速度来计算这个时间差，从而调节信号灯，也可以通过实时的车流监控来进行动态调节，维持“绿波”。</p>
<p><img class="aligncenter size-medium wp-image-57463" src="http://songshuhui.net/wp-content/uploads/2011/07/0-带左转的双向绿波ver2-300x240.png" alt="" width="300" height="240" /></p>
<p>其次，我们刚才只考虑了一个方向的车流，但是信号灯是两个方向同步的，问题似乎变得更麻烦了。不过，如果适当地设置信号灯的位置的话，我们也能在两个方向上同时维持车流的“绿波”。即使是在十字路口，需要考虑左转弯和另一方向的车流时，通过恰当地控制信号灯，我们还是可以尽量做到让有车一族们一路畅通，不仅避免了令人烦躁的开开停停，也减少了废气的集中排放。</p>
<h1>交通堵塞的罪魁祸首</h1>
<p>要解决道路堵塞的问题，还有不少方法。比如说在城市规划时，适当地使不同等级的住宅区和商业区交错分布，减少人们上下班的出行距离，对于缓解早晚高峰，也相当切实可行。但如果要从根本上解决这个问题，还是要对交通本身进行更深入的研究。</p>
<p>我们说交通工具是城市的血液，这不仅仅是一种类比。事实上，如果我们将车辆想象成液体中的分子，那么车辆在公路上的运动，与液体在管道中的运动有着相似之处。这使我们可以用类似物理上处理液体运动的微分方程来研究车辆在公路网上的行动。</p>
<p style="text-align: left;">不过，车流和水流也有不一样的地方。两股水流交叉时会互相穿行，好像另一道水流从未存在那样；但当两股车流交叉时，我们就必须设置红绿灯避免交通事故。另外，由于车是人驾驶的，所以速度的变化也受人的反应时间的限制，不能及时依据周围车辆的情况调整状态。相对于水流而言，车流的性质更像是粘性非常大的蜂蜜。这种特性使道路堵塞更容易发生。</p>
<p style="text-align: left;"><embed type="application/x-shockwave-flash" width="480" height="400" src="http://player.youku.com/player.php/sid/XMjg3OTczMjQ4/v.swf" quality="high" align="middle" allowscriptaccess="sameDomain" allowfullscreen="true"></embed><br />
（视频：交通堵塞的形成）</p>
<p>上面这个视频就很好地说明了这一点。车子本来在大圆环上是等距分布的，速度也相差不大，似乎不应该出现堵塞，但事实上，堵塞却出现了。从视频中我们可以看到，一开始车辆的运行是很顺畅的，但它们之间的速度有些微妙的差别，但是驾驶者通常不会留意。长时间运行后，有些车之间就会过于靠近。这种情况一旦出现，后面的车就会减速，等前面的车重新拉开距离，而这又会导致它之后的车减速。这种情况继续发展下去，因为人的反应需要时间，减速的情况就会越演越烈，最后就形成了局部的堵塞。</p>
<h1>让计算机消灭堵塞</h1>
<p>仅仅因为人的反应需要时间，就会导致原本不应该出现的堵塞。为了解决这个问题，最明显的方法就是用计算机去自动控制车速。计算机的反应时间比人快得多，如果它能够根据周围车辆的速度适当调节车速的话，就相当于减少了车流的“粘性”，从而使交通更顺畅。这种技术被称为自适应巡航控制（Adaptive Cruise Control，简称ACC）。</p>
<p>ACC系统配备有车载雷达，可以实时探测周围车辆的速度和距离，在正常行驶中尝试保持车辆之间的距离。当前方车辆减速时，系统会自动减速避让，否则则会加速保持距离。由于是计算机自动操作，反应自然比人类驾驶员要快得多。更先进的ACC系统甚至可以与路旁监控车流的传感器通讯，获取道路交通的更多信息，甚至可以与其它车辆的ACC系统通讯，共享更大范围的车辆情况，更有效地辅助驾驶。有了这种系统，我们可以有效地消除上面实验中的那种莫名出现的堵塞。</p>
<p>实际上，计算机模拟表明，装备有ACC系统的车辆，不仅可以使拥有它的人更快地到达目的地，无形中也会帮助整体的交通变得更加顺畅。在模拟中，如果车流中有装备了ACC的车辆达到四分之一，交通堵塞的数目就会明显下降。即使只有3%的车辆有ACC，也可能显著提高交通的流动速度。</p>
<p>不少汽车公司正在尝试开发实用性的ACC系统。ACC系统可以装载在一般的汽车上，但是能更精确快捷控制速度的电动车可能更适合装载ACC系统。现在还只有高档汽车才配备有这项功能，不过相信很快我们就能看见装载有ACC系统的普通汽车了。届时，相信我们能看见更顺畅的交通。</p>
<p>延伸阅读：<a href="http://songshuhui.net/archives/1964">法则与混乱</a></p>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/57461/feed</wfw:commentRss>
		<slash:comments>28</slash:comments>
		</item>
		<item>
		<title>纳什：无常命运中的美丽心灵</title>
		<link>http://songshuhui.net/archives/56711</link>
		<comments>http://songshuhui.net/archives/56711#comments</comments>
		<pubDate>Wed, 06 Jul 2011 23:24:28 +0000</pubDate>
		<dc:creator>方弦</dc:creator>
				<category><![CDATA[数学]]></category>
		<category><![CDATA[博弈论]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[科学人物]]></category>
		<category><![CDATA[纳什]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=56711</guid>
		<description><![CDATA[对很多人来说，数学家可能是遥不可及的存在。他们醉心于那个由各种抽象符号组成的世界，而似乎离现实很远很远。《美丽心灵》以诺贝尔经济学奖获奖者约翰·纳什的经历为素材，讲述了一位患上精神分裂症的数学天才，在爱与理智的帮助下，逐渐痊愈的感人故事。但电影毕竟是艺术抽象，它偏重于纳什博士与精神分裂症抗争的过程。那么，他属于数学家的一面，又是如何呢？]]></description>
			<content:encoded><![CDATA[<p>本文作者：方弦</p>
<table cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td>
<p>很多人来说，数学家可能是遥不可及的存在。他们醉心于那个由各种抽象符号组成的世界，而似乎离现实很远很远。《美丽心灵》以诺贝尔经济学奖获奖者约翰·纳什的经历为素材，讲述了一位患上精神分裂症的数学天才，在爱与理智的帮助下，逐渐痊愈的感人故事。但电影毕竟是艺术抽象，它偏重于纳什博士与精神分裂症抗争的过程。那么，他属于数学家的一面，又是如何呢？</p>
<div class="wp-caption alignnone" style="width: 280px"><img src="http://songshuhui.net/forum/attachments/month_1107/1107012125eddaecb0a3727eb4.gif" alt="young_nash_princeton_press.gif" width="270" height="412" /><p class="wp-caption-text">年轻时的纳什</p></div>
<p>“这人是个天才。”</p>
<p>这就是纳什的硕士导师给他写的推荐信，只有一句话的推荐信。</p>
<p>约翰·纳什的确是个天才。中学时代，在父母的支持下，他就开始在附近的大学旁听高等数学的课程了。尔后，他得到了卡耐基技术学院（今卡耐基-梅隆大学）的奖学金，攻读数学。仅仅用了三年时间，他就完成了硕士学位。在他寻找攻读博士的学校时，哈佛大学与普林斯顿大学都向他伸出了橄榄枝。普林斯顿提供的奖学金比较多，纳什认为这表明普林斯顿更看重他的才能。尽管哈佛大学的学术实力也很强，但“士为知己者死“，纳什还是选择了普林斯顿。</p>
<p>刚进入普林斯顿的纳什，不像电影描述的那个腼腆的天才。相反，他属于骄傲好胜的类型。他不爱上课不爱看书，相对于跟随前人的步伐，他更喜欢自己在数学的世界探索。吹着巴赫曲子的口哨，他可以独自做上一整夜数学，不知疲倦。</p>
<p>但普林斯顿并不是只有他一位数学天才。系主任莱夫谢茨，纳什的导师塔克，还有福克斯教授，都是当时各自领域的巨擘。而在与纳什同辈的学生中，也有像盖尔、沙普利这样日后的数学家，更值得一提的是当时的本科生米尔诺，这位日后的菲尔茨奖获得者。这些天才凑在一起，总爱分个高下，而像国际象棋和围棋之类的智力对抗游戏恐怕最对他们的胃口了，有事没事总有人在公共休息室里一局一局地下棋。不像电影中描述的那样，纳什其实算得上下棋高手。实际上，纳什当时研究的博弈论，正是一门以各种博弈为研究对象的应用数学分支。</p>
<div id="attachment_56739" class="wp-caption alignnone" style="width: 389px"><a href="http://songshuhui.net/wp-content/uploads/2011/07/1107070902a132942699c18be4.jpg"><img class="size-full wp-image-56739" src="http://songshuhui.net/wp-content/uploads/2011/07/1107070902a132942699c18be4.jpg" alt="" width="379" height="390" /></a><p class="wp-caption-text">一个博弈的收益图，其中心点是这个博弈的纳什均衡</p></div>
<p>当时博弈论仍然处于起步阶段，在高等研究所的冯·诺依曼是当时该领域的带头人，他对零和博弈作出了非常深入的研究。所谓零和博弈，即是所有对局者收益的综合为零，一方获益必然意味着一方损失。然而，现实生活中的博弈没有这么简单，双赢和两败俱伤的情况常有发生。就以当时美苏冷战为例，如果单纯将对方的损失看作己方的收益的话，双方的最优策略都是先发制人给对方最大的打击，这当然很不现实。由于这种局限性，尽管对零和博弈的研究非常深入，但在应用上价值不算太大。</p>
<p>于是，当纳什在1950年发表对非合作博弈的研究时，博弈学界眼前为之一亮。他证明了，即使放弃了“所有对局者收益总和为零”的假定（简称零和假定），对于每个博弈，仍然存在一个“均衡点“。在均衡点处，对于每位对局者来说，更改自己的策略不会带来任何好处；也就是说，每位对局者的策略都是当前的最优策略。这样的均衡点后来被称为纳什均衡。如果所有对局者都是理性的话，最后博弈的结果一定落在某个均衡点上。这就是均衡点重要性所在之处：如果知道一个博弈的均衡点，就相当于知道了博弈的结局。又因为去掉了零和假定，纳什均衡的应用范围远比零和博弈广泛。</p>
<p>以此为题材，在导师塔克的指导下，纳什完成了他的博士论文。可是，此时纳什的研究兴趣早已转向更纯粹的数学领域。甚至在他完成博士论文之前，他已经开始对代数几何——一个高度抽象的数学领域——产生了兴趣，并作出了一些开拓性的研究。</p>
<p>与博弈论不同，尽管代数几何在今天已经成为数学主流，在实际生活中它并没有太多的应用。在数学家的眼中，通常代数几何被分类为“纯粹数学”，而博弈论则是“应用数学”中的一员。虽然数学在众多的领域中有着重要的应用，但可能令局外人惊讶的是，近代的数学家并不特别看重应用，而更关注数学本身的智力美感。英国数学家哈代在他的《一个数学家的辩白》中就曾写道：“用实践的标准来衡量，我的数学生涯的价值是零；而在数学之外，我的一生无论如何都是平凡的。”。像纳什这样有才华的数学家，如果像在电影中那样只关注博弈论的话，实在难以想象。而纳什转向代数几何的一个原因，也正是因为担心关于博弈论的研究可能不会被数学系作为毕业论文接受。</p>
<p>纳什转向代数几何的另一个原因可能更容易明白。纳什均衡超越了冯·诺依曼的零和博弈研究，而因为冯·诺依曼当时也在普林斯顿，所以应该会出席纳什的论文答辩。纳什认为这样的状态可能对他不利。实际上，纳什曾与冯·诺依曼讨论他的纳什均衡理论，但冯·诺依曼并没有表现出多大的兴趣。“不过是另一个不动点定理。”这就是他的评价。所以纳什认为冯·诺依曼并没有意识到纳什均衡的重要性，很可能为他的论文答辩带来麻烦。</p>
<p>尽管数学家研究的是最纯粹的理论，他们有时也不得不面对那错综复杂的现实。</p>
<div class="wp-caption alignnone" style="width: 310px"><a href="http://songshuhui.net/forum/attachments/month_1107/1107012129c3079e6922c6247d.jpg"><img src="http://songshuhui.net/forum/attachments/month_1107/1107012129c3079e6922c6247d.jpg" alt="kummer2.jpg" width="300" height="300" /></a><p class="wp-caption-text">一个代数曲面</p></div>
<p>幸而纳什的博士论文答辩仍算顺利，从入学开始，仅仅花了一年半的时间，他就获得了普林斯顿的数学博士学位。这无论在什么时代都称得上高速度。也由于他的这篇论文，当时美国冷战智库兰德公司在他毕业后旋即将他招至麾下，因为他们认为纳什对非合作博弈的研究可能会在冷战中发挥作用。在兰德公司工作一年后，在1951年，他又回到了学术界，任职于麻省理工学院数学系。这时，他才将在普林斯顿对代数几何的研究写成论文《实代数流形》发表。</p>
<p>从1951年到1959年春天，纳什在麻省理工学院任职的这几年可以说是他在数学研究上最有价值的几年。他解决了黎曼流形在欧几里德空间中的等距嵌入问题，这个问题与广义相对论有着有趣的联系，属于微分几何——另一个高度抽象的纯数学领域——的范畴。这个问题跟很多纯数学问题一样，由于艰深，从未被大众所了解，但在当时算是相当重要的进展。这也是纳什在纯数学上最大的贡献。</p>
<p>尔后在1956年，他开始研究一个有关偏微分方程的问题。这时，他那种不爱看论文而独自研究的个性让他吃到了一些苦头。他并不知道，当时比萨大学的德乔治也在研究这个问题，已经有了一定的进展。实际上，他跟德乔治各自独立解决了这个问题。虽然纳什的解答更为精彩，然而是德乔治首先解决了这个问题。这种由于自己的无知而被他人捷足先登的经历，也许给纳什造成了一定的心理创伤。</p>
<p>在麻省理工学院的这段时间，纳什遇到了艾莉西亚，在1957年两人结婚了。在1959年的春天，艾莉西亚怀孕了。这时的纳什三十出头，在学术界有了一定的地位，还有一个美满的家庭。一切看起来都是那么美好。</p>
<p>谁又想到仅仅几个月后，纳什便堕入精神分裂症的深渊呢？</p>
<p>据纳什所言，他在艾莉西亚怀孕的头几个月开始出现妄想的思维，并不像电影描述的那样在进入普林斯顿伊始就出现了幻视。最初发现这点的可能是他的数学同事。当时纳什声称有了一个新想法，有希望解决黎曼猜想。黎曼猜想是解析数论的一个非常重要的核心问题，无论谁解决了这个问题，都会得到数学界无上的荣耀。然而，当他的同事与他讨论他的新想法时，却发现他的想法过于疯狂经不住推敲。尔后，纳什作了一个关于他的新想法的报告，但这个报告已经失去了思维的光泽。他的同事开始觉得，其中必定出了些什么问题。</p>
<p>更多的妄想症状陆续出现。纳什开始认为他是某个重要政治人物，有一个秘密团体在追杀他，这是典型的被害妄想症状。情况不断恶化，最后在1959年四月，艾莉西亚不得不将纳什送进精神病院。</p>
<p>为什么当时事业有成家庭幸福的纳什会突然患上精神分裂症呢？是不是没有做好妻子怀孕的心理准备导致的？“数学是年轻人的游戏”，是不是因为害怕自己的数学才能随着年龄增长而逐渐枯竭？是不是与德乔治竞争的经历给他带来了压力？又抑或是父母的遗传所致？我们难以给出一个准确的回答，因为我们对精神分裂症仍然知之甚少。但有一点可以确信的是，在精神疾病面前，即使是那些拥有最理性的心灵，研究最抽象的理论的数学家，也与普通人一样脆弱。</p>
<p>纳什被困在他的妄想之中。他开始出现幻听（但没有过像电影中的幻视）。入院治疗，出院后辞职逃往欧洲，被遣返美国治疗，离婚，胰岛素休克疗法，更多的药物治疗，出院。在1970年后再也没有入院治疗过，寄居在前妻家中。在这十年间，出现过几个月的短暂清醒时期。在这段时期，纳什做出了一些有意义的研究。但很快，他又陷入了妄想之中，而他的名字，也逐渐被数学界所遗忘。</p>
<p>但他的理论没有被遗忘。在他与精神分裂症缠斗之时，来自经济学界、博弈学界的学者们，在纳什均衡的基础上，发展出各自的理论，并将其应用到实践中，从股票市场到拍卖交易。他的理论以另一种方式记录着他的存在。</p>
<p>经过漫长的岁月后，奇迹发生了。纳什的精神分裂症像冰雪消融那样，一点一滴地缓解了。他开始理性地拒绝那些妄想，不再出现幻听，逐渐开始正常的生活和研究，甚至还学会了使用计算机。在八十年代后期，他开始利用电子邮件与别的数学家交流，这些数学家认出了纳什，而且发现他的数学思维恢复了，又开始进行有意义的数学研究了。正是这些数学家让大家知道，纳什从精神分裂症的深渊回来了。</p>
<p>部分由于这些数学家的努力，纳什开始重新被学术界承认。迟来的荣誉接踵而至，其中分量最重的莫过于1994年的诺贝尔经济学奖，获奖原因正是纳什均衡。随着这个诺贝尔奖，他又能以学者的身份重新拾起科学研究。尽管不再年轻，他仍希望能像过去那样，做出有价值的成果。他与艾莉西亚也在2001年复婚。尽管失去了数十年的宝贵岁月，对于现在的纳什来说，能平静地生活和研究，也许就是最大的幸福。</p>
<p>不得不说，有时候现实比电影更意味深长。《美丽心灵》只是纳什生平的一个不真实的写照，纳什本人的经历却更为动人。</p>
<p><img src="http://songshuhui.net/forum/attachments/month_1107/1107012125a316d56f254620bc.jpg" alt="john-nash-now.jpg" width="300" />
</td>
</tr>
</tbody>
</table>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/56711/feed</wfw:commentRss>
		<slash:comments>71</slash:comments>
		</item>
		<item>
		<title>志愿计算：足不出户，窥探星辰</title>
		<link>http://songshuhui.net/archives/52446</link>
		<comments>http://songshuhui.net/archives/52446#comments</comments>
		<pubDate>Tue, 05 Apr 2011 23:38:07 +0000</pubDate>
		<dc:creator>方弦</dc:creator>
				<category><![CDATA[学科]]></category>
		<category><![CDATA[计算机科学]]></category>
		<category><![CDATA[分布式技术]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[大众科学]]></category>
		<category><![CDATA[志愿计算]]></category>
		<category><![CDATA[计算机]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=52446</guid>
		<description><![CDATA[在我打下这行字之时，我的电脑正在分析着无线电信号，尝试在其中找到一种特殊的模式。这些无线电信号可能来自数万光年外的星球，而我的电脑正在寻找的，是一种特殊的无线电波模式，它最可能来自一种特殊的天体系统：由两颗超高密度的天体——其中一颗是中子星或者黑洞——紧密围绕组成的双星系统。这种系统非常稀少，现今发现的不过几十。]]></description>
			<content:encoded><![CDATA[<p>本文作者：方弦</p>
<p><div class="editornote"><p>按语：这篇文章在我的电脑上躺了很久了，一直没有写完。近日松鼠会受分布式拒绝服务攻击（DDoS）下线数天，有感于类似的分布式技术能被不法分子利用作凶器，也能为科学家利用而探索万千世界，一鼓作气赶写完了这篇文章，希望能让大家看到分布式计算技术的善意一面。</p></div></p>
<p><img class="aligncenter size-large wp-image-52447" src="http://songshuhui.net/wp-content/uploads/2011/04/Einstein@home_ABP-600x450.png" alt="" width="600" height="450" /></p>
<p>在我打下这行字之时，我的电脑正在分析着无线电信号，尝试在其中找到一种特殊的模式。这些无线电信号可能来自数万光年外的星球，而我的电脑正在寻找的，是一种特殊的无线电波模式，它最可能来自一种特殊的天体系统：由两颗超高密度的天体——其中一颗是中子星或者黑洞——紧密围绕组成的双星系统。这种系统非常稀少，现今发现的不过几十。</p>
<p>不要被术语吓倒，其实我和你一样，对天体物理所知甚少。我所做的，只是简单地下载了一个叫<a href="http://boinc.berkeley.edu" target="_blank">BOINC</a>的软件，加入了<a href="http://einstein.phys.uwm.edu/" target="_blank">Einstein@home</a>项目，让它利用我的电脑空闲时的资源，为科学而计算。</p>
<h2>大众科学</h2>
<p>长久以来，科学似乎一直给人的印象，是少数有天赋的科学家才能成就的伟大事业。从牛顿到爱因斯坦，从波义耳到凯库勒，科学一直以来都有着这种精英主义式的印象。才智似乎是参与科学不可或缺的要素。但在近代，随着计算机的发展，起码在实验科学中，数据逐渐变得重要起来。现在的技术条件越发进步，使得研究人员能获得大量的数据，而在以前这是不可想象的。例如密立根的油滴实验，当年需要研究人员肉眼盯着实验仪器手工记录油滴的运动状况，而现在，如果配备上适当的图像处理系统，研究人员只需简单敲敲键盘就能获得数据。</p>
<p>当数据丰盛起来之时，难题也随之而来：单凭人类的能力，无法处理越来越海量的数据。一个极端的例子是在日内瓦的大型强子对撞机（LHC），它每秒钟吞吐的数据量可达800MB，每秒的数据能填充一张CD还有余，一天下来大约有10万张CD-ROM，大概一万张DVD。这种“能压死人”级别的数据，如果没有计算机的强大计算能力的话，研究人员早已被数据淹没。</p>
<p><img class="alignnone" src="http://gridview.cern.ch/GRIDVIEW/dt/bin/gridftp_graphs.php?GraphName=All&amp;SiteVOOption=VO-wise&amp;ThruputDataOption=thruput&amp;DurationOption=current&amp;StartHour=0&amp;StartDay=22&amp;StartMonth=9&amp;StartYear=2008&amp;EndHour=12&amp;EndDay=22&amp;EndMonth=9&amp;EndYear=2008&amp;HostType=&amp;SrcTier=All&amp;DestTier=All&amp;SiteNameOption=Abbreviationgridftp_graphs.php?GraphName=All&amp;SiteVOOption=VO-wise&amp;ThruputDataOption=thruput&amp;DurationOption=current&amp;StartHour=0&amp;StartDay=22&amp;StartMonth=9&amp;StartYear=2008&amp;EndHour=12&amp;EndDay=22&amp;EndMonth=9&amp;EndYear=2008&amp;HostType=&amp;SrcTier=All&amp;DestTier=All&amp;SiteNameOption=Abbreviation" alt="" width="604" height="240" /></p>
<p>计算机在数据处理中的地位日渐强化，也意味着只要拥有计算机，一般人也可以参与到科学研究中。尽管没有实验仪器，对分析后数据的意义也不甚了解，但通过运行特定的数据处理程序，一般的科学爱好者也可以在科学研究中助研究人员一臂之力。就像我虽然不懂天体物理，但仍能搜寻新的天体，算是能一偿夙愿。另一方面，研究人员也需要对海量数据处理的能力。希望为科学出一份力的志愿者，需要计算能力的研究人员，两者干柴烈火一拍即合。</p>
<p>这种新的科研形式，就是志愿计算。</p>
<h2>蓬勃发展</h2>
<p>在1996年1月，George Woltman将他编写的Prime95程序发布到网上，并开始组织一场针对梅森素数的互联网大搜索，这个宏大的计划被命名为GIMPS（Great Internet Mersenne Prime Search）。当时，最强大的个人电脑CPU不过是奔腾Pro，奔腾II还要在一年半后才推出。在短短一年内，数以千计的数学奇客（Geek）参加了这个项目。也正是在这一年，一位参加者Joel Armengaud在他的电脑上发现了这个项目的第一个梅森素数：2<sup>1398269</sup>-1，打破了当时最大质数的世界纪录。这也许是Woltman意料之中的，但也许在他意料之外的是，他的这个项目开创了志愿计算的新时代，也是普通人参加科学研究的新时代。</p>
<p>至今，志愿计算仍在蓬勃发展。从寻找梅森素数的GIMPS到寻找外星文明的SETI@home，从搜寻引力波的项目Einstein@home到计算蛋白质折叠的Rosetta@home，这些志愿计算项目在研究领域上形成了一个很宽的谱。直至现在，活跃的志愿计算项目数量已经过百，其中新项目多半使用了志愿计算平台BOINC。这个平台与SETI@home这个人气最高的志愿计算项目是由同一个小组开发的。这就不难理解为何小组的负责人，加州大学伯克利分校教授David Anderson，会被一些志愿者视为这个领域的偶像了。</p>
<p>同时，志愿者的数量和捐献的计算能力也在不断增长。仅在BOINC平台上，目前活跃捐献计算能力的志愿者大约有30万名，投入了大约50万台计算机，计算能力大约是5.8TFlops，计算能力相当于2台目前最强的超级计算机——天河1A超级计算机。虽然总量很大，但志愿计算利用的，实际上只是计算机的空闲资源。在技术不断发展的今天，一般家用电脑的性能已经远超人们的想象。一台电脑，如果只是上上网写写报告的话，用到的CPU资源不过20%，而剩下的80%相当于浪费了。志愿计算利用的，正是这80%的资源。</p>
<p>聚沙成塔，对于研究人员来说，志愿计算项目就像一台便宜的超级计算机。如果研究课题能吸引大众兴趣的话，只要建立一个项目并做适当的宣传，研究人员就可以获得相当充足的计算资源。当然，这些运算能力并不是凭空得来的。谁能抓住志愿者那慷慨的心，谁就抓住了巨大的计算能力。项目的流行程度其实也就反映了该领域的流行程度。目前来说，最热门的是SETI@home，这反映了人们对地外文明的关注，其次就是物理类、生物医药类和环境气候类。</p>
<p><img class="aligncenter size-large wp-image-52448" src="http://songshuhui.net/wp-content/uploads/2011/04/Setiathomeboinc-600x450.jpg" alt="" width="600" height="450" /></p>
<h2>硕果累累</h2>
<p>虽然只有15年的历史，但不少领域得益于志愿计算，作出了不少成果。基于不同志愿计算项目的结果发表的论文数以百计，而且还在不断增长中，其中不乏高素质的研究成果。</p>
<p>例如Einstein@home，本来是用于处理引力波探测器LIGO和GEO 600的信号，尝试找到广义相对论所预言的“引力波”——时空的波动。大约在2008年，他们开始了一个新的子项目：搜寻短周期脉冲双星。脉冲双星（Binary Radio Pulsar，简称BRP）指的是两颗高密度星体——至少其中一颗是脉冲星——相互绕转组成的双星系统。这种双星系统会引起不小的时空弯曲，理论上来说也会发射引力波，可能成为以后探测的重点观察对象。此前多年的努力也只发现了8个BRP，但仅仅经过两年，这个子项目就找到了两个新的BRP。这也属于一种歪打正着。</p>
<p>另一个更现实的项目——Climate Prediction.Net——进程则稳定得多。这个项目旨在通过计算机模拟来研究各种不同要素对气候的影响。他们先后研究了洋流、硫化合物对气候稳态的影响，然后又对增加的二氧化碳浓度如何逐步演变气候进行了研究，而研究结果很多发表在重要的期刊上，比如说Nature。由于掌握了巨大的计算能力，这个项目的计算结果使研究人员对全球气候的变化有了更深的了解。在全球变暖的背景下，这些结果看来是相当重要的。</p>
<p><img class="aligncenter size-large wp-image-52449" src="http://songshuhui.net/wp-content/uploads/2011/04/800px-Scr_cpdn-600x359.png" alt="" width="600" height="359" /></p>
<p>其实很多研究团队，如果有足够的计算能力的话，也能做出不俗的工作。但由于经费的问题，他们常常不能如愿。如果只需要下载一个软件自动运行就能帮助这些研究人员，那么何乐而不为呢？</p>
<p>------------------------------</p>
<p>对志愿计算感兴趣或者有别的疑问的朋友，欢迎访问中国分布式计算总站（<a href="http://www.equn.com/" target="_blank">http://www.equn.com/</a>），在站点维基上有丰富的资料介绍。</p>
<p>图片取自中国分布式计算总站与LHC官方网站，数据采自2011年4月3日。</p>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/52446/feed</wfw:commentRss>
		<slash:comments>55</slash:comments>
		</item>
		<item>
		<title>人算不如天算 之 电脑中的微型大脑</title>
		<link>http://songshuhui.net/archives/45893</link>
		<comments>http://songshuhui.net/archives/45893#comments</comments>
		<pubDate>Thu, 25 Nov 2010 13:20:58 +0000</pubDate>
		<dc:creator>方弦</dc:creator>
				<category><![CDATA[计算机科学]]></category>
		<category><![CDATA[人工神经元]]></category>
		<category><![CDATA[人工神经网络]]></category>
		<category><![CDATA[人算不如天算]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[大脑]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=45893</guid>
		<description><![CDATA[在目前对大脑机理的研究水平上，不要说大脑的整体运作，就算是大脑神经元之间的互动，也还藏有不少谜团。但工程师有工程师的想法。他们不太关心具体机理，更关注这东西是否管用。对于大脑，工程师们想到的是：如果对神经元组成的网络进行适当的模拟，或许可以完成对于传统算法来说困难的任务。沿着这个思路，他们得到了“人工神经网络”，一类被广泛应用的人工智能算法。]]></description>
			<content:encoded><![CDATA[<p>本文作者：方弦</p>
<div id="attachment_45894" class="wp-caption aligncenter" style="width: 330px"><a href="http://songshuhui.net/wp-content/uploads/2010/11/20101109_33cd8808accc5906495fUBG1AdVXJ1rW.jpg"><img class="size-full wp-image-45894  " src="http://songshuhui.net/wp-content/uploads/2010/11/20101109_33cd8808accc5906495fUBG1AdVXJ1rW.jpg" alt="头壳下方的那东西" width="320" height="240" /></a><p class="wp-caption-text"> </p></div>
<p style="text-align: center;">
<p>你的大脑有多强大，你知道吗？</p>
<div id="attachment_45895" class="wp-caption aligncenter" style="width: 373px"><a href="http://songshuhui.net/wp-content/uploads/2010/11/20101109_fa25705373c0b9ba9df2nknBOOFChKkS.gif"><img class="size-full wp-image-45895  " src="http://songshuhui.net/wp-content/uploads/2010/11/20101109_fa25705373c0b9ba9df2nknBOOFChKkS.gif" alt="立体画" width="363" height="250" /></a><p class="wp-caption-text"> </p></div>
<p style="text-align: center;">
<p>看看这幅图，它是由两幅图像交替而制成的gif动画，是不是很有立体感？不需要多少思考，大多数人一瞄就能说出壁炉上各种器皿的位置或者木柴的大概纹理（伴随着晕眩的副作用）。但如果要通过计算机来建立立体模型的话，要先通过轮廓提取之类的方法找出两幅图像之间的对应点，然后计算相机的位置，最后才能用几何的方法将立体模型建造出来，这个过程涉及不少复杂的矩阵计算。但人脑似乎用某种奇异的方法，不费吹灰之力就完成了同样的任务。</p>
<p>不仅是人脑，似乎简单得多的动物，它们的脑在某些方面也有出众的表现。澳大利亚的一组研究人员就花了相当时间对苍蝇脑的视觉部分进行了分析，将其中一些神经元的活动以方程的形式提炼出来，结果得到了一个图像运动检测算法，在很多情况下比目前的算法效果要更好，效率也更高，但算法的整体原理在很大程度上仍然是个谜。</p>
<p>那为什么脑，或者说由神经元构成的网络，会有这么神秘而强大的能力呢？</p>
<p>研究大脑的学者恐怕会说：这个嘛，不太清楚。</p>
<p>对于大脑产生智能的具体机理，学界有很多不同的观点，但是在目前的研究水平上，不要说大脑的整体运作，就算是大脑的神经元之间的互动，也还藏有不少的谜团，所以，我们离揭示大脑能力的奥秘还差很远很远。要更进一步，还需要更精细的分析能力和更强大的计算能力。</p>
<p>但工程师有工程师的想法。他们相对而言不太关心具体的机理，更关注的是这东西是否管用。比如说从苍蝇脑里提取的算法，尽管研究人员既不明白每一步的意义，也不明白这个算法是如何一步一步演化形成的，但这不妨碍他们对这个神秘的算法的应用。据报道，已经有个别自动导航系统在使用这个算法了。</p>
<p>同样，对于大脑，工程师们想到的是：如果对神经元组成的网络进行适当的模拟，或许可以完成对于传统算法来说困难的任务。沿着这个思路，他们得到了“人工神经网络”，一类被广泛应用的人工智能算法。</p>
<p><strong>简单的拼板</strong></p>
<p>要模拟生物中的神经网络，那就要明白神经细胞之间通讯的大概原理。</p>
<div id="attachment_45896" class="wp-caption aligncenter" style="width: 279px"><a href="http://songshuhui.net/wp-content/uploads/2010/11/20101109_b9b427b985dddfa925c1hYrFGPmuYdIm.jpg"><img class="size-full wp-image-45896  " src="http://songshuhui.net/wp-content/uploads/2010/11/20101109_b9b427b985dddfa925c1hYrFGPmuYdIm.jpg" alt="神经细胞" width="269" height="359" /></a><p class="wp-caption-text">神经细胞</p></div>
<p style="text-align: center;">
<p>神经元细胞的构造相当复杂，主要由细胞体、树突和轴突构成。细胞体负责各种后勤和调控工作，而树突和轴突的功能则是完成细胞之间的通讯。树突负责接收其它细胞的信号，而轴突负责把细胞的信号传给别的细胞。如果神经细胞接收到的信息满足一定的条件，它就会被激活，然后开始向其它细胞传递信号。具体的信号处理与传递过程相当复杂，甚至还涉及其他种类的细胞。</p>
<p>但是，对于工程师来说，这样的描述甚至仍然太复杂了。本着抽象和过度简化的原则，他们建立了神经细胞的一个非常简化的模型：人工神经元。</p>
<div id="attachment_45898" class="wp-caption aligncenter" style="width: 472px"><a href="http://songshuhui.net/wp-content/uploads/2010/11/f.gif"><img class="size-full wp-image-45898  " src="http://songshuhui.net/wp-content/uploads/2010/11/f.gif" alt="人工神经元" width="462" height="329" /></a><p class="wp-caption-text">人工神经元</p></div>
<p style="text-align: center;">
<p>一个人工神经元可以分为三个部分。第一部分是输入，负责接收来自外部的信号；第二部分是信息处理，它将来自其它神经元的信号，按照信号的性质和重要性进行汇总后，再根据一定的条件判断是否发出信号，以及发出信号的强度；最后一部分是输出，将信号输出到外部，有可能是到别的神经元，也有可能直接作为神经网络的输出。</p>
<p>这是个相当简单的模型，真实的神经细胞运作的方式远远要更复杂。简单的模型好处在于编程和分析的难度都比较低。从实用性的角度来看，这要比实打实地模拟一个神经细胞更划算。</p>
<p><strong>容易的拼图</strong></p>
<p>接下来的工作，就是要将人工神经元拼起来，做成一个人工神经网络。这一步看起来不难，但到底怎么拼，要拼成什么样的结构，这仍然是个问题。</p>
<p>一个看起来明智的选择就是直接模拟大脑结构，也就是采用带有反馈的结构。这样一来更贴近大脑，二来也给充分利用了人工神经元之间的连接，有着更大的复杂性，看起来也更强大。</p>
<p>这是一个典型的“科学家的选择“，工程师们对此就可能不太同意。这种带有反馈的结构的确可能有更强大的性能，但它的复杂性也增加了编程和分析的难度。在“性价比”的考量下，对工程师而言，以下的结构（被称为“前馈结构”）可能更适合。</p>
<div id="attachment_45899" class="wp-caption aligncenter" style="width: 314px"><a href="http://songshuhui.net/wp-content/uploads/2010/11/qiankui.gif"><img class="size-full wp-image-45899   " src="http://songshuhui.net/wp-content/uploads/2010/11/qiankui.gif" alt="多层前馈神经网络" width="304" height="352" /></a><p class="wp-caption-text">多层前馈神经网络结构</p></div>
<p style="text-align: center;">
<p>这样的结构，是由几层人工神经元搭起来的。第一层神经元接受输入，最后一层神经元输出结果，而中间的每一层神经元，只能接受上面一层神经元的信号，然后将处理过的信号输出到下一层的神经元。因为这样的层状结构中不会存在信号的反馈，所以这种结构就被称为多层前馈结构了。</p>
<p>选择这种前馈结构的原因，自然是因为结构简单，但另一方面，它的性能是否足够强大呢？答案是肯定的。从数学上可以证明，在适当的条件下，这种前馈结构的人工神经网络，只要规模足够大，就可以对任意的连续函数进行足够好的近似。这个能力就足以（在近似的意义上）解决现实中的绝大部分问题了。</p>
<p>当然，也有研究人员在对其它结构进行研究，也得到了一些不错的结果。但在目前来看，简单有效的前馈结构在应用中仍然是非常热门的。</p>
<p><strong>牵引的连接</strong></p>
<p>即使选择好了结构，工作还远远没有完成。我们仍然需要确定对于整个网络至关重要的一些参数。方才提到，人工神经元会对外部传来的信号按照性质和重要性进行汇总，然后决定发出多强烈的信号。在这里，如何进行信号的汇总，以及按照什么方法决定发出信号的强烈程度，都是需要确定的。</p>
<p>我们当然希望模拟真实的神经细胞，毕竟它是我们唯一能模仿的对象。然而，真实的神经细胞的有关机制实在过于复杂了，我们目前仍不能窥其全貌，而且在工程学上来说，完整模拟这样复杂的机制也不划算。于是，我们只能退而求其次，尝试用尽量简单的机制来完成任务。</p>
<p>面对汇总的问题，一个经常用到的解决办法就是加权求和。对于每一个神经元，我们可以对每个输入赋予一个权重，汇总时，将每个输入的信号强度乘以相应的权重，然后求和。最后得到的结果，可以看成是输入的汇总。</p>
<p>接下来是决定发出多强烈的信号。对神经细胞发出信号的具体机制，我们仍不十分了解，但我们总可以假定，神经细胞发出的信号是关于接收到的信号的一个函数。类比到人工神经元的话，我们可以认为，人工神经元发出的信号就是关于输入汇总的一个函数。在实际应用中，一类经常被用到的函数是sigmoid函数。这类函数便于计算和性能分析，而又有真实神经元非线性的性质。</p>
<div id="attachment_45900" class="wp-caption aligncenter" style="width: 330px"><a href="http://songshuhui.net/wp-content/uploads/2010/11/hanshu.png"><img class="size-full wp-image-45900 " src="http://songshuhui.net/wp-content/uploads/2010/11/hanshu.png" alt="" width="320" height="213" /></a><p class="wp-caption-text">  </p></div>
<p style="text-align: center;">
<p><div class="editornote"><p><span style="font-size: 100%;">那么，为什么我们不选择更简单的线性函数y=ax+b呢？一个原因是，如果我们这样做的话，由于系统的其它部分都是线性的，整个系统可以轻易简化为一个线性函数。这样的话，我们就丢失了好不容易通过结构和连接创造出来的复杂性了，而这样简单的系统也不能满足我们解决复杂问题的需要。</span></p></div></p>
<p>现在，万事俱备只欠东风。整个人工神经网络中，只剩下一类参数还没有确定，那就是神经元之间连接的权重，但这恰好也是最难解决的问题。</p>
<p>我们在前面曾经提到一个定理：对于任意一个函数，只要我们有一个足够大的前馈结构的神经网络，我们都可以以任意精度来近似这个函数。这种对于任意函数的适应性，正是来源于我们可以自由选取人工神经元之间连接权重的这个能力。也就是说，对于不同的问题，我们需要选择不同的权重组合，而这个权重组合的计算方法，并不是显而易见的。</p>
<p>这个问题，对于自然中的神经网络——也就是各种生物的脑——也是存在的。那么，自然是怎么解决这个问题的吗？</p>
<p>答案就是：通过学习。</p>
<p><strong>点睛的一笔</strong></p>
<p>我们的人工神经网络，在很多方面都跟一只刚出生的小狗很相似：虽然蕴含着巨大的潜力，但一开始什么也不能做。既然我们可以训练小狗完成各种任务，那么，我们能不能想到一个办法，通过“训练”来确定人工神经网络的权重，从而“教会”它那些我们需要它完成的任务呢？</p>
<p>回想一下我们是怎么训练小狗“坐下”的。一开始我们下“坐下”的命令的时候，小狗通常会不知所措，因为它也不明白人类的语言。但偶尔它也会坐下来，这时候我们就会给它点好吃的或者摸摸头作为奖励。久而久之，这种服从命令的行为就会被逐渐强化，最后，小狗听到“坐下”的命令就会乖乖地坐下来。</p>
<p>对人工神经网络的训练，与训练小狗的方法其实相差不远：让它面对各种可能的情况，然后根据它做出的判断正确与否，适当地调整人工神经元之间的权重。比如说，在判断正确时，我们可以适当强化相关的人工神经元之间的连接，而在判断错误时则弱化之。在经过大量的重复训练之后，我们可以期望得到的人工神经网络能足够好地完成我们给与的任务。</p>
<p>但这也引入了另一个问题：如何根据人工神经网络输出的结果去调整权重？对于一般结构的神经网络来说，方法并不是显而易见的。幸好，对于我们考虑的多层前馈结构来说，我们有一个相对简单的权重调节方法，叫反向传递法（back-propagation）。这种方法的实质就是找到对判断有影响的连接，然后适当修改它们的权值。这也是我们在应用中更青睐多层前馈结构的一个原因。</p>
<p>到这里，大部分技术上的问题都已经解决了。对于我们选取的多层前馈网络，要训练它完成某项任务，我们先收集各种可能的情况以及应该作出的判断，然后根据这些数据利用反向传递法对人工神经网络进行大量的训练，直到它的表现足够好为止。这样得到的人工神经网络，<strong>在理论上</strong>应该就能足够好地完成任务了。</p>
<p><div class="editornote"><p>在这个过程中，仍有一些细节是需要注意的。</p>
<p>训练开始时，我们先给人工神经网络赋予随机的权重，避免手动选择权重所可能导致的偏差。这样的话，最后得到的人工神经网络的表现就仅仅依赖于我们用于训练的数据了。</p>
<p>如果训练使用的数据不够全面的话，训练出来的人工神经网络的可靠性也会降低。试想一下，如果一位厨师学徒，每天不停在练的都是粤菜，某天忽然让他做个酱骨架，那可能就做得淡而无味了。人工神经网络也是一样，要想它更好地应对各种情况的话，训练时就要让它“见识”更多不同的数据。</p>
<p>上面说到的学习方法，术语叫有监督学习，顾名思义就是在已经知道正确答案的情况下进行训练。实际上对于人工神经网络来说，别的学习模式（如无监督学习、强化学习）也是可以应用的，不同的学习方法可以解决不同领域的任务。</p>
<p>最后一点，人工神经网络并不是万能的。跟我们一样，它有时也会犯错。用人工神经网络解决某个问题，实际上就是将这个问题表达成某种统计的形式来简化解答，而在这个过程中不免会丢失原来问题的信息，使得解答并非总是准确。不过想到作为万物之灵的人类也经常犯错，人工神经网络的这点问题还是可以理解的。</p></div></p>
<p><strong>美妙的画卷</strong></p>
<p>但工程师并不满足于理论上的结果，他们是实践主义者，仅仅是理论上的可行性并不能成为他们接受一项新技术的理由。打个比方，理论上来说，每条河都有个源头，而要找到这个源头，只要溯河而上就可以了。殊不知当年为了探寻尼罗河的源头，有多少勇者败给了沿途的险恶环境而客死异乡。理论可以指出一条路，但这条路具体是好是坏，还是要脚踏实地走一走才知道。</p>
<p>幸而人工神经网络不负众望，在许多领域都有不俗的表现，如医学诊断、图像识别等。人工神经网络的灵活性，是传统的计算机程序所难以比拟的。在一些需要一定灵活性的领域中，当传统的计算机程序难以解决问题时，人工神经网络就能派上用场了。</p>
<p>然而，相比起自然中的神经网络，人工神经网络仍然不足挂齿。无论是在结构还是在运作方式上，人工神经网络都只是动物神经系统的一个极端简化的版本，在适应性和复杂度上远远逊色于原版。但最重要的区别是规模，大自然可以将数百亿计的神经元轻易安排在我们头骨以下那几立方分米的空间中，而我们想要模拟这些神经元，就必须动用最强的超级计算机，而且还需要很长的时间才能得到一些模糊的结果。</p>
<p>另一个重要的区别在于学习。我们的大脑可以轻易学习各种复杂的技能，还能根据以往的经验举一反三，但对于如此高效的学习过程，科学家仍然不清楚它的具体机理，甚至不清楚它是怎么发生的。可以想象，假以时日，当科学家们看清楚大脑的各种机理之后，会给工程师们指引一条改进人工神经网络的道路。</p>
<p>但道路的尽头，仍然是手执数十亿年时间优势的自然。在如此漫长的时光中，即使只有试错法，自然的创造仍然是无可比拟地美丽和强大。作为造物的我们，对自然各种创造的伟大和美妙之处的理解，才刚刚开始。</p>
<p><a rel="tag" href="http://songshuhui.net/archives/tag/%e4%ba%ba%e7%ae%97%e4%b8%8d%e5%a6%82%e5%a4%a9%e7%ae%97"><strong>人算不如天算</strong></a><strong>系列</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/45893/feed</wfw:commentRss>
		<slash:comments>31</slash:comments>
		</item>
		<item>
		<title>图像的现代魔术</title>
		<link>http://songshuhui.net/archives/39091</link>
		<comments>http://songshuhui.net/archives/39091#comments</comments>
		<pubDate>Sun, 01 Aug 2010 23:30:28 +0000</pubDate>
		<dc:creator>方弦</dc:creator>
				<category><![CDATA[计算机科学]]></category>
		<category><![CDATA[原创]]></category>
		<category><![CDATA[图像修复]]></category>
		<category><![CDATA[图像处理]]></category>

		<guid isPermaLink="false">http://songshuhui.net/?p=39091</guid>
		<description><![CDATA[现在的摄影爱好者对数码技术总是颇有微词。他们说，CCD记录的数字信号失却了世界各种细腻的美好，数字格式的照片遗失了胶片时代的质感。我不懂摄影，当然也没有资格评论这种感觉，但在另一方面，数码技术带来的便利也是显而易见的。]]></description>
			<content:encoded><![CDATA[<p>本文作者：方弦</p>
<a href="http://songshuhui.net/wp-content/uploads/2010/06/1.jpg"><img class="size-medium wp-image-40772" title="1" src="http://songshuhui.net/wp-content/uploads/2010/06/1-300x225.jpg" alt="" width="0" height="0" /></a>
<div id="attachment_39093" class="wp-caption aligncenter" style="width: 210px"><a href="http://songshuhui.net/wp-content/uploads/2010/08/1.jpg"><img class="size-medium wp-image-40781 " title="1" src="http://songshuhui.net/wp-content/uploads/2010/08/1-200x300.jpg" alt="" width="200" height="300" /></a><br />
<p class="wp-caption-text">内容感知填充</p></div>
<p>现在的摄影爱好者对数码技术总是颇有微词。他们说，CCD记录的数字信号失却了世界各种细腻的美好，数字格式的照片遗失了胶片时代的质感。我不懂摄影，当然也没有资格评论这种感觉，但在另一方面，数码技术带来的便利也是显而易见的。各种在胶片时代几乎是魔术的图像处理效果，在这个数码时代不费吹灰之力。</p>
<p>尽管胶片可以留住瞬间的景象，却也敌不过时光的侵蚀。十几年前的老照片，完好无缺仍然鲜活的就不多见。发黄的照片，扫描到电脑上校准一下色调就行了。但对于那些有折痕甚至缺损的照片，即使瑕疵多么微小，不得不说也是一种遗憾。以往，修复这些瑕疵，只能将其扫描到计算机中，然后用各种图像处理软件进行手工处理。这个过程，如果要得到良好的效果，即使对于专业人士来说，也是极费精力的。但应用一种名为“内容感知填充”的新技术，计算机可以自动完成这一切，而得到的结果很多时候也相当可取。</p>
<p>除了修复照片的瑕疵外，这项技术的另一个用途就是去除照片中碍眼的东西。试想一下，一张青山绿水的野外照片，草地上却有几个易拉罐，这恐怕有些煞风景。但在计算机上，只需选中这些杂物，轻点鼠标，这些“瑕疵”就被抹去了，留下的是绿油油的草地。</p>
<p>只需圈出需要修补的瑕疵，向计算机下达命令，数秒后照片就完好如初。粗看这种技术的确近乎魔术，但其实背后的算法很直白，就是“拆东墙补西墙”。将瑕疵标记之后，计算机就会接过手来，删除这一部分，然后尝试用照片其余部分的图案，一点一点填充图像的缺口。</p>
<p>算法最复杂的地方，就在于如何选取与填充。显然，填充的基本条件就是填充的图案要与缺口附近的图案相近，否则填充成一件百衲衣就得不偿失了。为了选取相近的图案，计算机会在缺口的附近或者纹理相近的地方，提取局部的图案一一比较，再选取最适合的。这一小片图像，在进行适当的处理后，就被填充到缺口中。如此逐步填充，最后完成的图像，虽远非完美，但起码不会有明显的局部拼接的痕迹。</p>
<p>这个技术，说起来虽然很轻松，但在实现上却远非如此。最繁重的工作就是找到匹配的局部图案，这需要对大量的数据组合进行模糊匹配。而填充的具体策略也会影响最后的效果。在很多情况下，结果也还不尽如人意，还需要进一步的修缮。但这项技术毕竟自动化了大部分的工作，降低了人工处理的工作量。</p>
<p>当然，内容感知填充也有它的限制。根据它的原理，我们知道它其实并不能猜测某个物体背后遮盖的到底是什么，它做的不过是拆东墙补西墙。所以，利用这种技术，从性感女星的火辣剧照中去掉衣服的努力是注定要失败的。但对于去除在繁杂背景前凸显的某些物体，比如说沙滩上某位碍眼的救生员的话，内容感知填充会给你带来意外的惊喜。</p>
<p>另一项与内容感知填充相近的技术，名为内容感知缩放，解决的却是另一个问题。当我们调整照片大小和比例时，照片上的物体也会相应地被拉伸或者收缩。林青霞的照片，稍稍拉伸一下，大概就可以冒充沈殿霞了。但我们有时也需要内容相同，尺寸不同的一系列图片，内容感知缩放解决的正是这一问题。在改变图片尺寸时，它可以帮助保持图片中主要内容不变，让女士的身材避免走形。</p>
<div id="attachment_39092" class="wp-caption aligncenter" style="width: 460px"><a href="http://songshuhui.net/wp-content/uploads/2010/06/seam_craving.jpg"><img class="size-full wp-image-39092" src="http://songshuhui.net/wp-content/uploads/2010/06/seam_craving.jpg" alt="内容感知缩放" width="450" height="545" /></a><p class="wp-caption-text">内容感知缩放</p></div>
<p>尽管名称相似，这项技术与内容感知填充的原理完全不同。在需要缩放图片时，计算机会利用一种叫“动态规划”的算法，计算一条由像素组成，贯穿照片相对边沿的最“不起眼”的路径，然后将它填充或者删去，图片的大小就变化了一点，重复多次就可以得到缩放的效果。而在这里，“不起眼”的像素路径，就是那些每个像素都与它的邻居相差不远，属于多它一个不多少它一个不少的类型。这就不难理解为什么填充或者删除这样的路径之后，图片的内容保持不变了。</p>
<p>同样，这项技术也不是万能的。如果图片的主要内容与背景相差不远的话，也可能被误伤，导致变形。弥补这个不足的办法相对简单：可以选定要重点保护的部分，这样在探查这些区域的时候，算法不敢越雷池一步，内容也得以在大刀阔斧的填充和删除下保存。</p>
<p>无论是内容感知填充，还是内容感知缩放，这些技术之所以在我们眼中仍有缺陷，是因为它们对于照片的内容，仍然处于“感知”的层面上，而不能像人那样“理解”照片的内容。计算机不能理解情人在背后会轻轻挽手，也不能理解易拉罐在草地上的反讽。对计算机而言，一张数码照片的所有意义就是像素构成的数据矩阵。而对于我们，一张照片意味着的，可能是家人的微笑，情人的可爱，或是自然的美好。照片代表的回忆，无论绚烂或平淡，都是计算机所不能理解的。</p>
<p>也只有照片负载的回忆，可以成为好好活过的证据。</p>
<p>【已刊于《艺术世界》七月刊】</p>
]]></content:encoded>
			<wfw:commentRss>http://songshuhui.net/archives/39091/feed</wfw:commentRss>
		<slash:comments>22</slash:comments>
		</item>
	</channel>
</rss>

<!-- Dynamic page generated in 0.274 seconds. -->
<!-- Cached page generated by WP-Super-Cache on 2012-02-10 16:14:06 -->

