科学松鼠会 » 方弦 http://songshuhui.net 剥开科学的坚果,让科学流行起来 Thu, 20 Sep 2018 22:34:26 +0000 zh-CN hourly 1 https://wordpress.org/?v=4.3.17 http://songshuhui.net/wp-content/uploads/cropped-songshuhui-32x32.jpg » 方弦 http://songshuhui.net 32 32 麻烦的埃及人,以及他们的单位分数 http://songshuhui.net/archives/102361 http://songshuhui.net/archives/102361#comments Wed, 19 Sep 2018 08:30:14 +0000 http://songshuhui.net/?p=102361

本文删改版刊登于微信公众号“果壳少年”,未经许可不得进行商业转载

你还能想起小学时被分数加法支配的恐怖吗?对于整数,加法比乘法容易,到了分数却好像反过来了。两个分数相乘,分子分母各自乘一下就完事了。两个分数相加,却要先通个分,一共要做三次整数乘法,真是麻烦。

但世界上就偏偏有自找麻烦的人,连表达再简单的分数,都偏要写成几个分数的和,那就是古埃及人。他们创造了金字塔这样的世界奇观,由此见得他们的数学水平也相当不错。但在有理数的运算上,他们却另辟了一条麻烦的蹊径。

图片来自pixabay

图片来自pixabay

埃及人发明了“n分之一”的写法,但却没有发明“n分之m”的写法。取而代之的是,他们将所有的分数都写成好几个不同的“n分之一”的和,3/4可以写成1/2+1/4,而2/5可以写成1/4+1/10+1/20。类似“n分之一”的分数是最简单的分数,它们又叫做单位分数,这种简单也许就是古埃及人选择用它们表达其他分数的原因,但只能说这种选择是捡了芝麻丢了西瓜……要算一下这些分数到底是多少,还得掰弄半天。

埃及分数表示法,下面的符号表示整数,上面的符号表示“……分之一”。图片编辑自Wikipedia

埃及分数表示法,下面的符号表示整数,上面的符号表示“……分之一”。图片编辑自Wikipedia

也许是出于对古埃及人谜样坚持的敬佩,数学家常常将单位分数称为埃及分数,尤其是涉及将有理数写成单位分数的问题中更是如此。

单位分数够用吗?

那么,一个自然的问题就是:是不是任何正有理数都可以写成有限个不同的单位分数的和呢?

你可能会说:单位分数会越变越小,如果有理数很大的话,难道不会出现单位分数不够用的情况吗?这个问题相当于在问:1+1/2+1/3+……一项一项加起来的话,能达到要多大有多大的值吗?

答案是肯定的!

对于任意的正整数n,我们来考虑从1/(2^n+1)到1/2^(n+1)的所有单位分数,它们一共有2^n个,而且都大于1/2^(n+1),所以它们的和至少是1/2。然后,如果我们考虑n的不同的值的话,n=0就是从1/2加到1/4,n=1就是从1/5加到1/8,n=2就是从1/9加到1/16。对于每一个的n,我们得到的和都至少是1/2。如果我们将n=0到n=k的所有情况加起来,也就是从1/2加到1/2^(k+1),那么得到的和就至少是(k+1)/2。因为k可以要多大有多大,所以这些单位分数的和也可以要多大有多大,不需要担心单位分数不够用的事情。

实际上,如果用上一点高等数学的话,我们可以证明,从1加到1/n,当n越来越大,这个和也会越来越接近ln(n)+γ,这里ln(n)是n的自然对数,而γ被称为欧拉-马歇罗尼常数。因为对数ln(n)会随着n增长而越变越大没有界限,所以自然可以要多大有多大。这个和在数学中又叫调和级数,有着广泛的应用。

怎么把有理数写成单位分数的和?

既然知道单位分数够用,我们就可以重新回到原来的问题了:用埃及人的做法,能表达所有正有理数吗?

这个问题并不简单。虽然古埃及人广泛使用埃及分数来表示各种有理数,但他们似乎没有一套完整的方法,可以将任意的有理数都转化为埃及分数的和。对于一些特殊的有理数,古埃及人通常会以某种固定的形式书写它们,比如说,对于正整数k,有理数2/(2k+1)就可以写成1/k+1/k(2k+1)。这样的公式还有很多,但是远远没有包含所有有理数。

这时我们可以换个角度:如果给你一个有理数m/n,非要你把它写成单位分数的和,你会怎么做呢?

我们先来考虑m/n小于1的情况。最自然的办法,可能就是先找最大的但不超过m/n的单位分数,把它写下来,然后看看剩下了多少,如果是单位分数的话,那就完事了;如果还不是的话,那就重复之前的操作。这种方法又叫贪心算法,因为每一步我们写下的都是最大的可能性。

举个例子,如果我们要将5/22写成单位分数的和,那应该怎么写呢?

首先,我们看看最大的不超过5/22的单位分数是多少。假设分母是k,那么我们就有以下的不等式:

1/k < 5/22 所以我们有k>22/5=4.4,而符合这个条件的最小的k,也就是使单位分数最大的k,就是k=5。所以,我们写出的第一项就是1/5,也就是

5/22 = 1/5 + 3/110

3/110还不是单位分数,所以我们要对3/110进行相同的操作。假设最大的不超过3/110的单位分数是1/k,那么它满足

1/k < 3/110 所以我们有k>110/3=36.666666……符合这个条件最小的k是37,所以接下来的一项就是1/37,也就是

5/22 = 1/5 + 1/37 + 1/4070

这回凑巧的是,剩下的恰好是个单位分数1/4070,所以我们就成功将5/22写成了单位分数的和。

那么,是不是所有小于1的正有理数都能用这种贪心算法写成有限个单位分数的和呢?这个问题似乎很难回答,如果每次都取最大的单位分数的话,怎么知道会不会每一次都会剩下一点点,而这一点点都不凑巧不是单位分数呢?幸好,我们可以证明这个算法必定会结束,对于任何小于1的正有理数,都必定会在某一步剩下一个单位分数。

怎么证明呢?我们来看每一步的操作具体是怎么样的。从m/n开始,我们假设最大的不超过m/n的单位分数是1/k,那么我们有以下的不等式:1/k < m/n,也就是k > n/m。因为k是整数,为了使1/k最大,k应该是大于n/m的最小整数,记作\( \lceil n/m \rceil \)。将1/k写出来之后,剩下的就是

m/n = 1/k + (mk-n)/kn

但我们注意到,因为k是大于n/m的最小整数,所以我们有n/m ≤ k < n/m + 1,也就是n ≤ mk < n+m,所以mk-n在0和m-1之间。如果是0的话,那就意味着m/n本身就是单位分数1/k了,我们的任务也就此完成;如果是1的话,剩下的是一个单位分数,我们的任务同样完成;否则,mk-n这个分子至多是m-1,严格小于原来的分子m。所以说,每写下一项新的单位分数,剩下部分的分子会比原来有理数的分子要小,约分之后就更加小了。因为分子不能无限减小,所以在某一步之后,剩下的数的分子必定会变成1,这时我们就将原来的数写成好几个单位分数的和了。 从这个证明,我们还能看出来,如果m/n小于1,那么最多只需要m步,贪心算法就会完结,而写出来的表达式也最多有m个单位分数。这是因为每一步剩下来的数的分子都至少会减少1,所以贪心算法最多只能执行m步。另外,我们可以证明这个贪心算法写出的所有单位分数都不一样(想一想为什么?),所以,这个算法实际上告诉我们,每个小于1的正有理数都可以写成有限个不同的单位分数的和,而且给出了具体怎么写的一种方法。在数学中,这又被称为构造性证明。

那么,对于大于1的有理数a又应该怎么办呢?我们之前提到,将正有理数写成不同的单位分数时,无论这个有理数有多大,单位分数都不会不够用。那么,我们只要将单位分数按照1+1/2+1/3……这样写出来,直到这个和延伸到小于a的最大值,然后再按照贪心算法来操作,就能将有理数a写成单位分数的和了。我们可以证明,这样写出来的单位分数各不相同,符合之前提到的要求。当然,如果a很大的话,需要的单位分数的个数也会很多,但毕竟总是有限个。

所以,埃及人的做法还是有一些道理的,既然所有有理数都可以写成不同的单位分数的和,那么用单位分数来表达有理数也没什么毛病,除了写起来可能复杂一点。

为什么贪心不是件好事情?

当然,贪心算法给出的结果不一定是最好的。如果我们要将有理数写成单位分数的和,我们自然希望这个和越简单越好。这个“简单”有两个条件:一是单位分数的分母越小越好,二是用到的单位分数越少越好。很遗憾的是,贪心算法对这两点都做不到。

首先是第一点,在之前的例子里,我们用贪心算法将5/22写成了这几个单位分数的和:

5/22 = 1/5 + 1/37 + 1/4070

但仔细观察中间步骤5/22 = 1/5 + 3/110的话,我们可以发现一个分母更小的写法:

5/22 = 1/5 + 1/55 + 1/110

分母一下子变成了原来的四十分之一!所以说,有时候太贪心也不是什么好事。

然后是第二点,虽然我们知道,如果将m/n用贪心算法写成单位分数的和,这个和最多用到m个单位分数,但有时候我们可以做得比贪心算法更好。举个例子,如果要将5/121写成单位分数的和,那么贪心算法给出的结果是

5/121 = 1/25 + 1/757 + 1/763309 + 1/873960180913 + 1/1527612795642093418846225

这里边包括了五个单位分数,外加大得吓人的分母。但其实如果思考一下的话,会发现5/121可以写成简单得多的形式:

5/121 = 1/33 + 1/121 + 1/363

如果举一个更加极端的例子,我们可以考虑31/311,它可以写成

31/311 = 1/12 + 1/63 + 1/2799 + 1/8708

这个写法的分母有点大,但不算特别吓人。大家可以试一下用贪心算法来处理31/311,体会一下为什么贪心是不好的。

最简单的写法,能有多简单?

那么,将有理数写成单位分数的和,这种写法可以有多简单呢?数学家为了这个问题煞费了苦心。他们证明了,对于任意在0和1之间的有理数m/n,都能写成分母不超过O(n ln n (ln ln n)^4 (ln ln ln n)^3)的单位分数的和,又或者是写成最多需要O((ln n)^(1/2))项单位分数的和。这些界限大概有多大呢?我们知道,对数函数ln的增长非常非常慢,十的对数ln(10)比2大一点点,一万的对数ln(10^4)也只比9大一点点,一百万亿的对数ln(10^15)也只是34.5多一点,即使到了10^100,它的对数也只是230。所以,n的对数在n面前基本上可以忽略。也就是说,任意在0和1之间的有理数,都能写成分母比原来大好几倍但远远小于原来分母平方的单位分数的和。它也有一种表达方法,最多需要对数开平方这个数量级那么多项,对于我们能想象的范围,大概就是个几十项的样子。数学家还猜想,其实项数不需要那么多,只需要O(ln ln n),也就是对数的对数这么多项就可以了,但到目前为止还没有人能证明这一点。

有些数学家甚至将“省事”推到了极致。大数学家埃尔德什和施特劳斯猜想,任意形如4/n的有理数,都能写成最多3个单位分数的和:

4/n = 1/a + 1/b + 1/c

埃尔德什(左)与陶哲轩(右),图片来自Wikipedia

埃尔德什(左)与陶哲轩(右),图片来自Wikipedia

对于所有小于10^14的数,这个猜想都成立,而且数学家也证明了这个猜想对几乎所有的n都成立。但是不是真的对所有n都成立呢?这还是个未解之谜。也许你可以试试找出一些公式,给出一部分n的解答。

]]>
http://songshuhui.net/archives/102361/feed 4
把空水杯放耳朵上,会有一种大海的声音,这是为什么? http://songshuhui.net/archives/101347 http://songshuhui.net/archives/101347#comments Thu, 21 Jun 2018 23:16:03 +0000 http://songshuhui.net/?p=101347 我小时候第一次到海边,第一次比拳头还大的螺壳,就做了每个人都做过的事情:把螺壳拿到耳边听一听。我听到了一些声音,仿佛来自很远的地方,而有些人似乎把它叫做大海的声音。当然,要听这种声音,不一定要螺壳,拿个空的水杯也行,甚至就用手罩住耳朵也可以。但是似乎在海边听到的,更加清晰,更像大海。

这种声音是怎么出现的呢?似乎没有东西发出任何声音,那我们听到的是什么?

图片来自pixabay

图片来自pixabay

我们可以做几个小实验观察一下。

首先,我们注意到,无论是螺壳还是水杯,都没有办法完全罩住耳朵,耳朵和容器之间总有缝隙,其中的空间总与外界相连。如果想办法将这些缝隙堵死,你会发现声音好像消失了,或者至少是变小了很多。这就说明,这个声音跟外界有关系,很有可能就是来自外界。

然后,为了验证这一点,我们可以做一个小小的对比试验:在房间里开一下风扇或者空调,调到噪音比较大的模式,然后听一下水杯;再把风扇或者空调关掉,再听一下水杯;最后躲进被窝再听一下。你会发现,似乎外部噪音比较大的时候,水杯中听到的声音也比较大;如果没什么噪音的话,听到的声音也比较小。因为其他条件都是一样的,所以这说明,水杯中的声音应该来自外部的噪音,但跟水杯和耳朵缝隙之间的空气流动没什么关系。

最后,我们听声音的时候,会发现听到的声音似乎跟容器的形状有关。可以用不同的水杯或者容器来对比,而更方便的方法就是用手虚握拳罩在耳边,然后用另一只手将虚握的拳头另一端的开口覆盖又打开,你会发现声音,尤其是音调明显发生了变化。

如果要考虑音调的变化的话,我们已知最熟悉的例子就是各种吹奏乐器。吹奏乐器之所以能发出声音,是因为其中的空气形成了共振腔,会将簧片或者吹嘴的声音修饰为能引起内部空气和乐器本身共振的声音。如果参照这个原理的话,水杯的声音也就很好解释了:水杯和耳朵之间形成了一个共振腔,其中的空气通过共振可以集中某些频率的声音,而外部的噪音就是“吹奏”这个共振腔的“演奏者”。这就可以解释之前我们观察到的现象了:如果将缝隙堵上,外部噪音的空气振动无法传到内部,当然也不会听到声音;如果外部就没有什么噪音的话,没有人“吹奏”,自然也没有声音;我们能听到的声音,取决于能使共振腔中的空气产生共振的频率,所以改变共振腔的形状,声音也会随之改变。

图片来自pixabay

图片来自pixabay

可以说,“大海的声音”,实际上就是外部窸窸窣窣的细微声音的振动,通过缝隙传到耳朵和螺壳之间的共振腔中,被空气的共振所集中,然后被我们听到而已。之所以我们会留意这种声音,是因为共振腔只会集中某些频率的声音,所以我们听到的声音有特定的音高和音色,就像乐器一样,而跟外面杂乱的噪音不一样。而之所以在海边听到的“大海的声音”更加清晰令人印象深刻,是因为海边不停有高低起伏的海浪声,也给我们听到的“大海的声音”赋予了一种特别的节奏。

也许令人意想不到的是,类似的想法也可以用来形象地解释量子力学中的一种神秘现象:卡西米尔效应。人们发现,如果在真空中将两块不带电的金属板平行放置,当它们贴得很近的时候,两者之间会产生一种神秘的力量,尝试将它们拖到一起。跟“大海的声音”一样,人们一开始不知道这个力的来源,因为似乎没有任何施力物体。但后来人们发现,通过量子力学可以解释这个现象。

在量子场论的眼光中,真空并不空,而是充满了无法探测的电磁振动。这些振动有着不同的“声调”,而能够传到两块金属板之间的,就只有一部分“声调”的电磁振动。这种选择性就是卡西米尔效应的来源。当然,这里的解释非常粗浅,只是一种直觉上的解释,要完全正确的解释卡西米尔效应,还是要去认真学习相应的物理理论和公式。

图片来自Wikipedia

图片来自Wikipedia

本文系悟空问答签约稿件,未经许可不得进行商业转载

]]>
http://songshuhui.net/archives/101347/feed 2
脱离物理的数学有意义吗? http://songshuhui.net/archives/101343 http://songshuhui.net/archives/101343#comments Fri, 15 Jun 2018 22:57:23 +0000 http://songshuhui.net/?p=101343 数学在物理中应用非常广泛。甚至可以说,很多数学就是脱胎于物理的需要而产生的。很多人就此产生了数学是依附于物理的感觉。他们不禁要问:脱离物理的数学还有意义吗?

这个问题的回答是:数学的意义,正是它能够脱离一切具体的研究对象,包括物理。

图片来自pixabay

图片来自pixabay

举个例子。人们一开始定义实数,是因为它描述了物理世界中发生的事情,比如说距离和时间。那么,如果我们最后发现这个宇宙其实符合所谓的“数字宇宙”原则,也就是说拥有最小的组成单元,而其他一切东西都可以由此推出,那么是不是意味着实数就失去了意义?

并不是,原因有几个:

首先,实数的定义本身有其必然性。实数,其实就是有理数的自然延伸。有理数虽然运算很容易,但有一个问题,就是它不允许取极限,或者说,它构成的度量空间不是完备的。而作为度量空间,有理数的完备化自然给出了实数。而完备空间的概念也是自然的,因为它就是度量空间上连续性的体现,而连续性本身也是自然的,因为它本质上就是对元素的无限序列的一种考虑。

其次,实数的用处,不仅在于最基础的物理。所有有关概率的问题,比如说统计物理的问题,实质上都需要用到实数的概念。这是因为,通过将离散转化为连续,很多时候问题就能大大简化。即使在最基础的物理中,比如弦论,也需要用到很多高深的数学,比如霍奇积分等等,这些高深的数学也需要奠基在实数的基础上。

另外,即使宇宙拥有最小的组成单元,根据量子物理,概率(或者说希尔伯特空间)仍然是本质和必要的,而这就是奠基于复数以及实数的。基本上,在目前所有最前沿的理论中,都需要用到概率的元素,也就是实数。

最后,也是最重要的:实数在许多领域中都有着应用,而即使不考虑这些应用,实数本身就有研究价值。

数学最大的价值,不在于它有多少应用。应该反过来说,正是因为数学的研究方法,所以它能用到各种地方。

很多人也许会觉得,数学就是用于计算的学科,很多人在学习数学时,因为这种想法,往往只去机械地记住公式然后计算,却不去理解这些公式是怎么来的,也不在意这些定理的来源。这种想法其实不好,相当于将数学最有价值的部分丢弃了。

数学是什么?数学是研究抽象结构以及它们之间关系的学科。正因为它们没有具体附着在任何东西上面,所以它们能应用到任何条件合适的问题上。只要符合实数的公理,无论是物理量,还是生物种群,又或者社会心理,实数的数学理论都能用上。正因为它什么都不是,所以它什么都是。

所以说,数学,正是因为能够通过抽象这一利器,脱离物理,脱离化学,脱离一切学科,它才拥有了普适的意义。数学的意义不在于它能帮助我们解决某一个学科的问题,而在于无论什么问题,只要符合一定的前提,都能利用同一套数学理论解决。

这就是为什么数学是最基础的工具,也是科学的女王。

本文系悟空问答签约稿件,未经许可不得进行商业转载

]]>
http://songshuhui.net/archives/101343/feed 14
为什么在逻辑学中不存在前提正确而结论不正确的情形? http://songshuhui.net/archives/101340 http://songshuhui.net/archives/101340#comments Sun, 10 Jun 2018 22:57:12 +0000 http://songshuhui.net/?p=101340 对于不太懂数理逻辑的人来说,逻辑推演就像是魔术。把奇怪的符号摆弄一通,竟然可以从正确的前提导出无比复杂,但却必然正确丝毫不爽的结论。这是为什么呢?

首先要搞清楚一点,当我们谈到逻辑的时候,这种指意几乎都是不明确的,因为逻辑不止一个,而是有无数种不同的可能性,我们将其称为不同的逻辑体系。在数理逻辑中,这些不同的体系描述了不同的数学系统,有着不同的性质。有的比较弱,但足以解答很多问题,也可以让我们能利用计算机进行自动推理;有的比较强,能解答的问题更多,甚至能成为几乎所有现代数学的逻辑基础,但在这样的系统中,对于某些命题,虽然我们知道它是真的,却没有办法在有限的时间内在体系中给出证明。

但所有这些系统,几乎都拥有同一个性质:如果前提是正确的,那么结论也必定是正确的。

作者David Rosenthal,来自http://facpub.stjohns.edu/~rosenthd/

作者David Rosenthal,来自http://facpub.stjohns.edu/~rosenthd/

不过,即使这种说法也很模糊。正确,是相对于什么来说正确?一串符号本身是没有正确错误之分的,要分出这一点,必然要将符号和外部的某些东西来比较。

这种东西就是数理逻辑中所谓的“模型”。比如说皮亚诺公理,它的模型就是自然数,因为人们提出这套公理就是为了将自然数这个体系公理化。为了做到这一点,所有公理都是被设计好,能恰当地刻画相应的模型,而从公理推出的结论也都是正确的,而这种正确,指的就是在模型内正确,也就是说相应的命题,无论它的自由变量在模型中取什么值,得到的结论在模型中都是正确的。在数理逻辑中,逻辑体系的这种属性又叫可靠性(soundness)。

当然,你可能会说,我们有很多逻辑体系,有描述自然数的,有描述实数的,有描述集合的,它们用到的推理规则都是一样的。那么,为什么不同的逻辑体系,即使描述的东西不一样,它们也都满足可靠性,也就是说从符合模型的公理推出的结论也必定符合模型?

这是因为,推理规则本身也是一种逻辑体系,或者更加准确地说,逻辑体系就是推理规则加上公理,而推理规则本身也是可以变化的。现在常用的推理规则,它的选择并非漫无目的,而正是因为它满足可靠性的条件,我们才选用了它。

那么问题又回来了。我们之前说过,正确性之类的性质,需要跟外部的某个东西作比较,才能得到结论,而可靠性也是这样。那么,对于推理规则来说,“外部的某种东西”又是什么呢?

答案就是命题结构本身。举个例子,命题逻辑的模型就是对于命题真假的赋值,以及如何计算复合命题(A蕴含B之类的命题)的真值。用这个模型很容易就能证明命题逻辑演算的可靠性。一阶逻辑的模型就是所谓的Herbrand结构,它实际上就是命题真假赋值的一种延伸,通过这个结构可以将一阶逻辑演算的可靠性归结为命题逻辑演算的可靠性。对于更高阶的逻辑,或者其他种类的逻辑(比如线性逻辑),我们也能找出类似的结构。

说来说去,为什么逻辑演算绝对能得到正确的命题,答案其实很简单。为了探索世界,我们需要判断命题的真假,还有一些逻辑运算。而我们定义对应逻辑体系的方法,就是构造一个能满足我们的需求,也就是从真命题必然推出真命题的逻辑体系。正是因为我们希望逻辑体系是可靠的,所以我们才去定义了可靠的逻辑体系,而逻辑体系也因此而可靠。

要记住,逻辑体系不是天上掉下来的,它也是人类心血的结晶。对世界的探索是因,逻辑体系的出现才是果。

本文系悟空问答签约稿件,未经许可不得进行商业转载

]]>
http://songshuhui.net/archives/101340/feed 0
解构与复原:望月新一与他的证明 http://songshuhui.net/archives/101102 http://songshuhui.net/archives/101102#comments Fri, 18 May 2018 23:25:06 +0000 http://songshuhui.net/?p=101102 fukugen

復原

在伊万·费先科(Ivan Fesenko)的“科普”文章里提到,在关于望月新一证明的讨论中,有一个词经常被提到,就是“復原”。在望月新一构建的崭新数学体系中,他将同时附着在“数字”之上的加法结构和乘法结构拆开,将两者各自变形,然后重新“復原”。这种做法,先从根本上消解,之后再““復原”,即使对于久经抽象推理沙场的数学家而言也相当奇怪。而望月新一的体系,正系于这种“復原”的可行性。

如果他的体系是正确的,如果他的“復原”是成功的,这将带来数学中代数几何分支的变革。比如说,ABC猜想的证明。比如说,最终理解加法和乘法之间的关系。但现在,没多少数学家能读懂他的证明。无论证明是对是错,也许数学界,至少是代数几何,恐怕难以复原为以前的面貌。他的体系,他的证明,已经将数学家拆开成不同的阵营,阵营内部不断发酵变化,引出了新的分歧。即使最后尘埃落定,得到的恐怕也只是望月新一式的“復原”。

但这就是数学前进的必经之路。

破题

望月新一的研究领域,是所谓的“远阿贝尔几何学”。如果只能用几十字解释这个领域的话,我只能这样写:

远阿贝尔几何学研究的是,有理数的绝对伽罗华群,以至任意代数簇的平展基本群,它们“远离阿贝尔”的部分,也就是不符合交换律ab=ba的部分,会如何影响相应代数结构的性质。

看不懂?很正常。要解释这个领域研究的是什么,可能需要整整一篇文章(请参看《小朋友的涂鸦(四):一个规划的大纲》),还不一定能解释清楚。而为了写这篇文章,还要找一个远阿贝尔几何的专家,而不是像我这样搞组合数学的人。

是的,对于望月新一的体系,我,这篇大部分人很可能读不懂的文章的作者,只理解一点最基础的皮毛。对于一般人来说,我似乎是内行,但在数学界内部,我属于吃瓜群众。所以,如果真正的内行看到我写错了东西,请多多包涵。

但面对这个体系,很多数学家的境况并不比我好得多。包括菲尔兹奖得主陶哲轩,包括望月新一的恩师法尔廷斯,他们都抱怨望月新一的证明太简略太难懂。现在,据说懂得整个证明的,除了望月新一之外,只有十几个人,大部分在日本,其他在美国和法国。

大部分数学家,和这十几个人,就是目前的两个阵营。

抽象的极致

望月新一的体系,名为“宇宙際Teichmüller理論”(inter-universal Teichmüller theory),简称IUTT,有时候也省略对应“理论”的T,写成IUT。

他并没有特意发明这个略显中二气息的名字,这锅要由代数几何的先驱格罗滕迪克(Grothendieck)来背,是他发明了Grothendieck universe这个数学对象。而这个术语可能还要追溯到更久远的集合论先驱,因为它对应着集合论中“所有集合组成的一堆东西”这个概念。是的,所有集合不构成一个集合,只能说成“一堆东西”,或者用“类”这个术语。幸好,中文的翻译“全类”没有那么中二。用上这个翻译的话,中文可以写成“跨全类Teichmüller理论”。但为了原汁原味起见,我们后面还是用“宇宙”这个术语。因为,另一个universe的数学,总有些不一样。

我们从他此前研究的最最基础的结构,p进整数,谈起。

p进整数是什么?对于数学家来说最快捷易懂的定义,就是:

对于素数p,\( (\mathbb{Z}/p^n\mathbb{Z})_{n \geq 1} \)的投影极限

我第一次看到这个定义时,一下子就读懂了。这对数学家来说的确是好懂的定义,但对一般人就像外星语言。

绝望了?这就是我读望月新一的论文时,从第三页开始的感受,六百多页之中的第三页。

但p进整数毕竟没那么复杂,下面我试着解释一下。首先,我们来看一个p进整数的例子,取p=7,那么下面这几个数都是p进整数:

......00000000000000000042
......30211045064302335342
......12450124501245012450

是的,你没有看错,省略号在前面。每个p进整数,都可以看成一串向左边高位延伸至无穷的数。但它们并不是无穷,它们每个数都不相同,而这种写法是有意义的。

在p进整数上,可以定义加法和乘法。这里我们可以松一口气,因为它们的计算方式跟我们熟悉的一样(需要模p),从低位开始,然后慢慢进位计算,就像是永远做不完的加法和乘法。减法和除法同样由此定义。所以,p进整数跟我们熟悉的整数一样,都有四则运算。每个整数都对应一个p进整数,只消在整数的p进制表达式前面加上无穷个0,而它们的运算结果也与我们熟悉的运算别无二致。

奇怪的事情现在才开始。

1/5=0.2,显然不是整数。但它是一个7进整数:

1/5 = ......5412541254125412

震惊!图片来自pixabay

震惊!图片来自pixabay

实际上,只要一个p进整数x个位不是0,那么它的倒数也是一个p进整数。可以求倒数这一点非常重要,这意味着p进整数,或者它的推广p进数中,拥有完整的加法和乘法结构。

奇怪的事情到这里还没有完。

我们可以定义p进整数的“绝对值”,或者说“大小”。我们来看看在p进整数中,几个自然数的绝对值。我们还是取p=7为例子。

0的绝对值是0,简直必然。

1的绝对值是1,没有问题。

2的绝对值是1……等等,发生了什么事?

什么鬼……图片来自flickr | Denise Mattox

什么鬼……图片来自flickr | Denise Mattox

3、4、5、6,它们的绝对值都是1。

7(也就是七进制的10)的绝对值是1/7,突然变小了。

8(也就是七进制的11)的绝对值是1,又回来了。接下来9、10、11、12、13的绝对值都是1。14(也就是七进制的20)的绝对值又变成了1/7。

就这样,如果不是7的倍数,绝对值就是1;如果是7的倍数,绝对值就是1/7。一直到49(也就是七进制的100),它的绝对值变成了1/49。加上一的50,它的绝对值又是1。

简单来说,对于p进整数,从个位开始有几个0,它的绝对值就是p的几次方分之一。对于p的幂,次数越高,数字越大,“绝对值”反而越小。

根据这个奇怪的“绝对值”,我们可以将所有p进整数看成一个空间,它的结构由这个“绝对值”,也就是两点之间的距离给出。但这是个怪异的空间:每个三角形都是锐角等腰三角形,而如果取一个球体的话,球体中每一个点都是球心。

p进数,图片来自Wikipedia

p进数,图片来自Wikipedia

p进数拓扑结构的图示,来自Wikipedia

p进数拓扑结构的图示,来自Wikipedia

一个自然的疑问是:这都是什么玩意儿???

有这种疑问很正常,因为这属于抽象而反直觉的数学。但对于数学工作者来说,这种绝对值的定义,恰好呼应了p进整数本身的定义。如果明白一开始那个一句话定义,那么现在这个“绝对值”的概念,就会显得顺理成章,甚至非此不可。这就是对数学概念的理解程度所导致的偏差。初看似乎不明就里的数学概念,一旦掌握了正确的思维方法,就会变得浅显易懂。

但这又谈何容易!数学是如此抽象,必须经过多年的学习,慢慢熟习它的思考方式,才能理解它的内容。

p进整数,以及它的推广p进数,不仅在望月新一以往的工作出现,事实上,它早已是数论中常用的工具。当年怀尔斯对费马大定理的证明也用到了p进数。望月新一此前发展的p进Teichmüller理论,则完全基于p进数,但p进数本身在这个理论中的地位,相当于高考数学中的自然数,只是最基础的砖石。

而望月新一的新理论,“宇宙際Teichmüller理論”,又是另一个层次。他觉察到,用p进数构建的理论仍然不足以抓住他想要研究的那个数论结构,于是他另辟蹊径,找到一个已经证明必定能抓住那个结构的数学对象,然后构建起新的数学理论,研究这个对象的性质,从而导出他寻找的性质。这大体就是宇宙际Teichmüller理论的发展动机之一。

要构建这样的理论,需要同时用到远阿贝尔几何与表示论的工具,然而这两者格格不入,难以调和。为了折中,望月新一需要将理论的基底,也就是最基本的运算,拆成加法和乘法两部分,将它们消解为更复杂更抽象的结构,通过这些结构的互动和变形得到想要的性质,最后证明这些结构能够重新“復原”成某种加法和乘法。在互动和变形的过程中,他要在不同的宇宙(universe、全类)间游走,才能得到足够广泛而一般的结论。加法和乘法结合起来会碰到的障碍,对于它们消解而成的结构却不成问题,当然前提是通过恰当的变形,就像不同坐标系之间的变换。这就是为什么望月新一要将他的理论称为“宇宙際Teichmüller理論”。顺带一提,消解后的加法和乘法面目全非,不像通常的加法和乘法那样基于同一套“数字”,而是形同陌路,望月新一的术语alien ring structure就由此而来。这里的alien,并不是什么“外星”的意思,而是取拉丁语alienus的原意“属于他人、非自身、外来、奇怪”之义。很多地方写的什么“外星算术全纯结构”(alien arithmetic holomorphic structure),都曲解了望月新一的本义。

看不懂?很正常。上面对望月新一理论的描述,来自我查阅相关资料后的总结。但要知道,我主要的研究领域是组合数学,虽然跟通常的Teichmüller理论有那么一丁点关系,但对于一般的代数几何,我也没有正式学习过,只是通过闲谈和阅读懂得些皮毛。望月新一的资料,我只能抓住其中只言片语,描绘大体的图景。

这就是现代的数学,它研究的内容如此广泛如此深入,一个分支上的数学家已经难以理解另一个分支的前沿,更何况是代数几何这一最抽象的领域中耕耘的人特别少的分支远阿贝尔几何,它的最前沿的推广呢?更何况这个理论是如此抽象,处理的又是如此根本的数学结果。可以说,拥有足够的知识储备,有充足时间能够理解并审查望月新一理论的数学家,即使不能说屈指可数,也很可能不超过100人,这还是相当乐观的估计。

望月新一本人这样说过,他的理论在数学界的处境,就像数学本身在整个社会中的处境:过于抽象,以至于人们不愿意去钻研和理解。

争议与迭代

一个新的证明或者理论体系,给数学界带来重大影响,这并不是第一次。

大卫·希尔伯特,图片来自Wikipedia

大卫·希尔伯特,图片来自Wikipedia

希尔伯特,就是那个提出20世纪的23个数学问题的著名数学家,他的成名之作,那篇“终结了不变量理论”的论文,在当时就引起了巨大的争议。此前,不变量理论的大多数进展都基于具体的计算,需要给出具体的结果。这样的证明又叫构造性证明。但希尔伯特的证明不属此列,而分属“存在性证明”,能断言某个数学对象的确存在,但对于如何计算却绝口不提。他一开始投稿恰好碰上了当时的“不变量之王”哥尔丹。哥尔丹对这样的证明颇有微词,他的退稿评价是:

这不是数学,这是神学。

但最终希尔伯特幸得克莱因的保荐(“这无疑是这本杂志发表过有关一般代数的最重要的工作”),论文得以发表。正因为无需具体给出构造,存在性证明要比构造性证明要更为简洁有力,也因此逐渐被广泛接受。即使是一开始拒稿的哥尔丹,最后也承认了希尔伯特的工作,“即使是神学也有其价值”。希尔伯特之后也因为公理化的工作以及其他数学成就,跻身当时数学界的顶尖。

另一位为数学界作出巨大贡献的德国数学家康托尔,他的命运却大不相同。在研究傅里叶分析时,康托尔领会到无穷之后仍有无穷的无穷。他从最基础的集合论开始,建立了一个全新体系,描述了超越无穷的无穷,也就是超穷。集合论中的很多基础结果,就出自他的手笔。

格奥尔格·康托尔。图片来自Wikipedia

格奥尔格·康托尔。图片来自Wikipedia

但他的研究甫一发表,就遭到许多顶尖数学家的攻讦。庞加莱说他的想法就像“严重的疾病”,正在感染数学这一学科。当时执德国数学界牛耳的克罗内克,公开反对康托尔关于超穷的理论,甚至到达了人身攻击的地步。他称康托尔为“科学骗子”、“背叛者”、“腐蚀了青年”,近乎偏执地指责着康托尔和他的理论。

但数学毕竟是数学。经过曲折发展之后,集合论成为了现代数学的基础,成了数学系学生的必修课。正是希尔伯特作出了这样的断言:

身处康托尔跟我们一道展开的天堂内,我们屏息于惊叹之中,知道无人能将我们由此驱逐。

但康托尔本人的命运,却远没有那么光明。也许是因为得不到理解,也许是因为这些无休止的攻击,康托尔患上了抑郁症,一直没有痊愈。他的晚年恰逢第一次世界大战,贫困加剧了战争带来的饥谨。心脏病给他的最后一击,也许是种解脱。

一个人的命运,即使有再多的自我奋斗,始终逃不出历史的进程。领头人的个人好恶,足以令一个人万劫不复。即使他的理论被广泛接受,在生前领受过荣耀,也不过如此。

亚历山大·格罗滕迪克

亚历山大·格罗滕迪克,图片来自上沃尔法赫数学研究所(Mathematisches Forschungsinstitut Oberwolfach)

格罗滕迪克的遭遇,处于康托尔和希尔伯特之间。他的数学风格高度抽象,但却能得出实际的结果。引用我之前写的文字

他谈论的数学实在过于抽象,难以理解。但这就是格罗滕迪克做数学的风格:尽可能从数学对象中将不必要的细节抽象出来,抽象得一般的数学家都会以为剩下的只有“虚空”,然而他仍然能从“虚空”中抓住某些东西,从而建立他的理论,完成他的证明。用格罗滕迪克本人的说法,如果把数学问题比作坚果,大部分数学家做的就是用锤子和凿子把坚果凿开,而他的做法则是将坚果浸在水里,慢慢软化它的外壳,又或者让它经受风吹日晒,然后等待合适的时机,坚果自然就会裂开。

对于大部分数学家来说,这个过程太漫长,也许只有拥有深刻洞察力的格罗滕迪克,才能在能接受的时间内,用这种方法解决问题。这也是他的数学难以被理解的原因之一:他几乎不考虑具体的示例,都是从尽可能抽象的角度出发,思考支配某个数学问题背后的宏大数学结构。有时候这也会闹出笑话。有一次讨论数学的时候,有人向格罗滕迪克提议考虑一个特定的质数作为例子。“你的意思是找一个真实的数字?”格罗滕迪克有点疑惑。对方点了点头。他回答:“好吧,我们考虑57这个质数。”57当然不是质数,但格罗滕迪克大概没有注意这一点,他从来不考虑具体的例子,一切从抽象出发。

格罗滕迪克的这种风格,让他年纪轻轻就全套改写了代数几何所用的数学语言,给这个领域带来了全新的抽象思维方式,让代数几何成为数学中可能是最抽象最深奥但也最有力量的分支。

但在他提出所谓的“标准猜想”之后,情况悄然改变。格罗滕迪克提出这一系列猜想,是为了阐明某些非常深层次的算术结构的存在性,一旦这些猜想得到证明,许多数论中的猜想,比如韦尔猜想,也能得到解决。不幸的是,由于标准猜想本身过于抽象,处理的问题过于广泛,所以久攻不下。雪上加霜的是,他的学生德利涅绕过了标准猜想,取道更“经典”也没那么抽象的技巧完成了最后一个韦尔猜想的证明。这就使很多人的注意力从标准猜想上移开,他之后写出的研究纲领也应者寥寥。最后,他慢慢隐退到比利牛斯山脉之下,在前不久成为了历史。

但格罗滕迪克毕竟留下了庞大的数学遗产。他编写的EGA和SGA是代数几何的入门宝典,他的定理和想法,尤其是标准猜想,仍然留在众多代数几何学者的心头。

当然,新理论新证明被彻底摧毁的例子也比比皆是。在2004年,美国数学家路易·德·布朗奇(Louis de Branges)在自己的个人页面上贴出了一篇124页的论文,声称利用自己发展的基于希尔伯特空间的一套体系,证明了数论中最引人注目的黎曼猜想,跟望月新一的情况相当相似。因为德·布朗奇此前曾证明另一个著名猜想——比伯巴赫猜想(Bieberbach conjecture),所以也有人关注他的证明。但直至现在,论文经过多次修改,似乎仍然站不住脚。目前数学界普遍认为他并未能证明黎曼猜想。

不停有人提出新的想法,即使一开始不被接受,历经时间洗练,终将得到应有的评价,而数学也就此进步。虽然提出新想法的人,他们各自有需要承受的命运,不以他们的贡献为转移。这就是数学史。

而望月新一的理论,就是在当下展开的历史。他的理论是对是错,只能拭目以待。

理论的渗流

闻道有先后,术业有专攻。

新理论总有个渗透的过程,即使是相应领域的专家,也不可能一下子全部理解。而现代数学高度专业化的体系,更使不同分支的数学家难以相互理解。望月新一之前耕耘于代数几何中的远阿贝尔几何,但代数几何方向甚多,而远阿贝尔几何又是一个少人问津的领域,能评判望月新一工作的专家,不消说是少之又少。雪上加霜的是,望月新一这次提出的新理论不仅仅是远阿贝尔几何,而是它的延伸,再加上高度的抽象性和庞大的页数,足以令一部分专家望而却步。

但新理论的确有其吸引力。望月新一本人在代数几何这个领域早已名声在外,他在1996年就证明了格罗滕迪克提出的一个有关远阿贝尔几何的猜想,还因此被邀请在1998年的国际数学家大会上作45分钟演讲。既然他之前的工作证明了他有如此能力,那么他的新工作当然也值得认真对待。何况,望月新一宣称他的新理论能够用于证明数论中悬而未决的ABC猜想,这就更让人期待了。

有些数学家被新理论所吸引,花了大量时间研读,自觉理解了箇中真谛,成为了为新理论摇旗呐喊的人。

有些数学家同样被新理论说吸引,花了大量时间研读,但感觉还是解释不清,难以理解。

有些数学家对新理论有兴趣,但没有时间研读,只能交给别的专家。

有些数学家不懂这个分支,只能围观。

望月新一的“宇宙際Teichmüller理論”(IUTT),就这样将数学界分成了两大阵营:觉得自己读懂的,还有觉得自己没懂的。围观群众不在此列。

觉得自己读懂了的数学家,他们在积极地宣传这个理论,想让更多的人理解它。伊万·费先科也是其中一员。近年来,在世界各地召开了数次讨论IUTT的研讨会,费先科有不少牵线搭桥之功。他和其他数学家也撰写了不少介绍IUTT的文章和综述,试图用不同的视角来讲述这个理论。

觉得自己没有读懂的数学家,有的仍在努力研读,有的尝试用自己知道的数学方法来从侧面验证IUTT的正确性;也有的已经放弃,转而对IUTT的正确性产生了怀疑。

每个新理论都会经历这个阶段,这个等待验证的阶段。只有经过这个阶段,等到大部分专家接受它的正确性,新理论才算是正式确立,数学也得以进步。

只是,对于IUTT来说,这个阶段似乎太长了一点。

同样是代数几何中的新突破,另一位数学家彼得·索尔策(Peter Scholze)在2011年前后提出的perfectoid空间,很快就被数学界所承认,证据就是他从2012开始获得的一系列殊荣。要知道,他提出这个理论的时候还只是博士生,但在2012年答辩之后,没过多久就被母校波恩大学重新聘请为教授,以24岁的身份创下了德国史上最年轻教授的记录。熟悉德国教育系统的人,会更感叹他的成就,因为在德国,教授的地位很高,聘请的条件也因此非常苛刻。这更凸显了他的成就。

彼得·索尔策。图片来自Wikipedia

彼得·索尔策。图片来自Wikipedia

那么,索尔策和望月新一,两人的理论为何遭遇迥异?

索尔策的理论处于代数几何研究的主流,能理解的专家人数比较多,而望月新一的理论则不算主流,专家也比较少。有时候人多人少,也能决定理论被接纳的速度。索尔策的理论包含的新意,很快就能被读懂并应用到新的问题上;望月新一的IUTT则是全新的系统,略有格罗滕迪克的遗风,看起来波澜不惊,但结论出人意料,需要吃透整个系统,才能判断最后的证明是对是错,但过于浑然一体,也让别人难以进行旁敲侧击式的验证,偏偏这种验证也正是考验新理论最快的方法。

对于望月新一来说,这些都是非战之罪。虽有忮心,不怨飘瓦。

但望月新一自身也并非毫无责任。对于现代数学家的标准而言,他的个性也稍有乖张之处。即使他曾经在美国生活过,在回到日本之后,他就很不愿意到海外与其他数学家交流。他并非不乐意交流,证据就是在2016年的一次IUTT研讨会上,他曾通过视频通话接入会场,为与会数学家解答一些疑难问题。而他窝在京都长时间自己捣鼓这一套理论,也不是数学界通常的做法。一般来说,数学家至少会跟同一个实验室的同事讨论相关问题,在讨论之中,可以获得更多灵感,也能借此检验理论是否正确,或者投石问路,看看是此路不通还是大有可为。上一个口风像望月新一那么严的,还是证明了费马大定理的怀尔斯。当然,数学家经常开学术会议互相交流,少不免走漏风声。我当然不知道望月新一有没有跟同事讨论,很可能有但是同事的保密工作做得很好,也许没有但这个可能性很低,又或者关注远阿贝尔几何的人实在少。但结果就是,当这个证明出现之时,人们毫无心理准备。

另一个可商榷之处,就是他在公开他的理论时,没有选择数学界一般会使用的预印本网站arXiv,而是直接放到了自己的个人页面上。当然,论文放到什么地方,这是他的自由,但也使数学界不能及时了解他的理论。不过话又说回来,这项工作引起的轰动,也很快让他的论文为数学界所知,所以其实问题也不大。

可以说,他的个性或者说偏好,在客观上的确阻碍了他与同行之间的交流。

结果就是,现在即使接受IUTT的专家越来越多(对于一个相对冷门的领域来说,十几个专家不算少数),但这些专家相当一部分是望月新一在日本的同事,还有过从稍密的同行。当然,也有相对独立的学者认为他们同样搞懂了望月新一的证明,但人毕竟也会犯错,很多旁观的数学家认为,现在认同的人数还不够多。

数学这门学科虽然有无可辩驳的逻辑作为守门人,但它仍然是一种人类活动。新理论无论是对是错,总要有足够的人承认,才得以确立。确立后的理论也不一定正确,确立后被推翻的证明虽不多,但也有。只有当大部分专家都理解了这个理论,再也挑不出毛病,从而站到了“自认为懂”的阵营里,甚至能由此生发出新的结果,理论才算真正确立。没有相应专业知识,或者不肯花时间的人,都只是局外人,没有权利对理论的正误说三道四。

但事情毕竟在进展。据说,目前IUTT的四篇论文中,前两篇构建的体系已经被许多专家认为成立,即使是那些觉得没有读懂整个证明的专家。目前争议的焦点之一,在于第三篇论文的推论3.12,也就是Szpiro猜想的证明关键。Szpiro猜想能推出ABC猜想,也难怪大家特别关注这个推论。据说,在之前的版本,推论3.12的证明只有几行,语焉不详,但我看到的几天前(2017-12-14)的新版本中,望月新一加上了好几页的注解。我只能希望这些注解能消除某些专家的疑惑。

发表与审阅

在验证证明的这个节骨眼上,从日本传来了一段诡异的新闻:据说望月新一关于ABC猜想的论文即将发表,发表的期刊是《数理解析研究所公刊》(Publications of the Research Institute for Mathematical Sciences),简称PRIMS。

欧洲数学协会网站上有关PRIMS杂志信息的截图

欧洲数学协会网站上有关PRIMS杂志信息的截图

这段消息来自日本的《朝日新闻》,算是老牌媒体,而且近水楼台,也难怪消息出来之后,引起了数学界的轰动。

在数学界,评定一个证明是否正确的标准之一,就是“在同行评议的正规学术期刊上发表”。要想做到这一点,就要把论文寄到期刊的编辑部(现在通常用网页系统),接受之后的一连串审核。

首先,编辑部在接到论文之后,会指派一位相关领域的编辑处理这篇论文。个别期刊可以由作者指定编辑。编辑会先进行初审,初步考量这篇论文是否适合在本期刊发表。绝大部分明显有问题的论文会在这一步被筛选排除。这一步不需要花多少时间。

然后,编辑会指定几位较为资深、在论文相关领域中有过贡献的同行,邀请他们进行审稿。这一步主要是审查证明的正确性和内容的原创性。到底选几位,不同的期刊面对不同的文章也有所不同。有单选一位的,也有12人委员会的先例,但大多数情况是两到三位。审稿人精读论文之后,会给出各自的意见,编辑负责将这些意见整合,得出一个结论。结论有这几种可能:拒稿、大修(major revision)、小修(minor revision)、发表。如果结果是拒稿或者发表,审稿人的工作就此完成;否则,编辑会将审稿人的意见和结论发给论文作者,让作者进行修改后,提交新的版本。新的版本会让审稿人重新审读,如此往复,直到最终拒稿、最终发表或者作者自行撤回论文。

这也是论文发表需时最长的阶段。越好的期刊,能请到的审稿人水平越高,审理也越严格。因为要有深入的理解,才能判定正确性,所以审稿人通常会花上很长的时间来审读,确保每个细节都没有问题。我自己当然投过稿,每次审稿意见回来都会惊叹于审稿人的细致,许多细微的笔误都会一一指出;我自己也替一个不算特别好的期刊审过稿,精读那篇论文花了我一个月电车上下班的时间,那还只是一篇十几页的文章。正因为严格,所以来来回回拖上三四年的例子也不算罕有。

这就是论文发表能作为金标准的原因之一:能发出来,证明至少有两三个跟你没什么关系的同行,差不多理解了你的论文,而且相当细致地确认了你的证明是对的。一般来说,无法通过这一阶段的论文并不多,因为大多数数学论文在投稿之前,作者都会先与同事交流,再于预印本网站(如arXiv)发表,也会在一些学术会议上宣讲。如果论文有严重的问题,通常在这些阶段的交流之中就会被指出。作者敢于投稿的,大部分都起码不会有严重的问题。

这场审稿的拉锯战,最大的得益者是之后希望研读的数学家。既然已经有人读过,说明论文是可以理解的,而拉锯过程中作者对论文的修改,更会让其中的理论和证明更易于理解。可以说,审稿人、编辑和作者在这个阶段的来来回回,就是在不断打磨论文本身,使其更晶莹通透,能让人一览无遗。

最后,编辑在得出结论后,如果决定这篇文章可以发表,那么就会将文稿交给出版社的编辑,进入最终的文稿编辑流程。值得一提的是,在整个过程中,无论是编辑还是审稿人,他们所做的大量工作,全都一文不取。

但望月新一这次却有点蹊跷,因为望月新一的工作单位,正是数理解析研究所,而他本人,就是PRIMS这个期刊的主编。一时舆论哗然,很多人觉得,这种行径可能在伦理上说不太过去,有些人更是作起了无端的恶意猜测。

因为新闻实在太大,Nature的Davide Castelvecchi给PRIMS编辑部发了一封电子邮件求证,而PRIMS很快作出了回应:

望月教授有关宇宙际Teichmuller理论的几篇论文仍未被期刊接收发表,因此我们很抱歉,RIMS无法对此评论。

The papers of Prof. Motizuki on inter-universal Teichmuller theory have not yet been accepted in a journal, and so we are sorry but RIMS have no comment on it.

措辞很审慎,也有点奇怪。根据最后一句,期刊的回复似乎站在RIMS,也就是数理解析研究所的立场。这样的话,难以判断望月新一的论文是否的确投给了PRIMS。但如果这些论文不在PRIMS手头上的话,那么他们又如何知道论文仍未被接收发表,也就是说仍未通过审议过程呢?但望月新一本人就是主编,他自己肯定知道自己论文的情况,所以也不能排除论文没有投到PRIMS,而是望月新一本人或者知道内情的同事所作的回复。

这也难怪望月新一不喜欢媒体。在他的主页底部,有一句话,用很大的艺术字体写着:本站点的内容和图片不得用于媒体报道。所以,这篇文章不能有他的照片。看看现在,新闻即使在日本发表,在不当的翻译下,传来传去也惹出了大风波。

但即使望月新一的确将论文投到了PRIMS,一般来说也无需担心利益冲突的问题。原因之一,是数学界早已有一套相当完备的系统,用以避免利益冲突。在选定编辑和审稿人时,一般来说,与任何一名作者在五年内合作发表过文章的,指导过任何一名作者研究的,还有与任何一名作者共处一个实验室甚至一个学校的,为了避嫌都不能参与。有些领域研究的人太少,要是全避嫌了可能也不剩什么人,这时候编辑也会慎之又慎,有时候甚至会为了避嫌,邀请研究领域稍远,但可能对论文内容有所了解的研究人员进行审稿。即使是主编,这套系统也会照常运作,不给情面。

也许你会说,那既然望月新一本人是主编,那么他不是更应该避嫌,不要将论文投到PRIMS,以免瓜田李下?我觉得他也许就是这样做的,因为我们还不知道他论文的去向。但也有一种可能,就是他并不在意论文在什么地方发表。毕竟他已经发布了自己的新理论,也吸引了专家研读。证明是否正确,领域内部自有定夺。即使投稿,也不过是一种寻找审读者确认的方式。在哪个期刊,并不重要。数学界也了解现在的情况,所以只是颇有微词,并没有群起而攻之。

说一点我个人的想法。我个人完全不担心望月新一所谓的利益冲突和学术伦理问题,最大的理由就是他没有动机。他已经功成名就,不需要什么文章。数学这种东西,对就对,错就错,不存在编数据或者实验造假,一切细节都在文章里。要是错了,无论强行发表在什么期刊上,也终有一天会被发现,而一发现就无可抵赖,只能重新修补。而且数学家对于证明的疑心很重,甚至到了偏执的地步。别人可能觉得差不多对了,数学家考虑的却是有什么地方可能出问题。在这种高标准下,疏失犯错固情有可原,故意造假则得不偿失。另外,正常的学术评价体系也不会过多考虑文章的发表,而是会综合考虑同行的评价,多发几篇文章并没有什么用。况且,一个造假发现就会身败名裂,甚至有人会以死谢罪的国家和体系,我觉得不能跟大部分读到这篇文章的人身处的环境相比。很多人的担忧,也许只是从此处自身感受作出的一种投射。

对于数学来说,文章发表并不是研究的终点。尤其是对于像望月新一的新理论那样重要的结果而言,数学家会前仆后继地研究它、理解它、挑剔它,尝试在其上生发出新的结果,或者找出它的错误。广中平佑当年需要两百多页才完成的奇点消解定理,在经过许多数学家的理解和简化之后,现在有了不少的简化证明,其中有些只需要二十页,原来的十分之一,而数学界对奇点消解的理解也远胜以往。数学是活着的,数学有它的生命,而发表并不是它的终点。

当然,我不是说数学家都白璧无瑕。数学界自有它的阴暗角落,就算是“自认为懂”望月新一新理论的阵营内部,也有各种奇怪的事情在发生,而两个阵营之间的争吵也很有难说谦谦君子之处。但证明总在日光之下。

况且,做纯数学的人,如果没有一点热爱数学的心,恐怕也很难久坐数学研究这一钱少活难的冷板凳。也许望月新一并不介意数学界甚至他自己领域之外的人如何看待他。他只要能做出好的数学,就可以了。

想想佩雷尔曼。

证明与理解

从目前的迹象来看,望月新一应该已将论文投向某个学术期刊,而且也应该断断续续收到了一些审稿意见,间接证据就是他的论文不断在更新,当然大多数是他与同事同行讨论的结果,但一些澄清概念的注解也很有可能是为了回应审稿的意见而写下的。

那么,如果期刊收到像望月新一的论文那么难读的投稿,应该怎么审稿?

世上数学家不少,总有几个在相关的研究领域钻研。如果投稿处在期刊的专业范围内,那么编辑肯定能找到能够审核论文的专家。当然,专家是否愿意审稿又是另一回事,但只要接受了审稿,那基本的专业素养就有了保证。既然审稿人是专家,就不会完全读不懂。也许会有一些不太理解的地方,但这时审稿人可以通过编辑向作者反映情况,要求更详细的解释。这样一来二去,慢慢地也就读懂了,可以作出评判。论文的终审稿通常会比初稿容易理解得多,这就要归功于审稿人、编辑和作者的共同努力。

当然,论文有两种难度。有些论文,例如佩雷尔曼对庞加莱猜想的证明,本身不长,但是因为高度抽象,以及作者各种跳步省略,导致文章极其难读。有些论文,例如Almgren某篇关于几何测度论的论文,本身就很长,一共1728页,差不多是望月新一四篇论文合计页数的三倍。这么长的文章,即使不需要检查正确性,慢慢地读下去也很费劲。

望月新一的论文也许两种难度兼具,但原则上并非不可逾越。不要低估数学家的耐心。

那有没有可能作者也没有办法解释,导致专家也不明白呢?

你可能会觉得,作者不也是人么,只要是人,就肯定有办法解释啊。人又不是机器。

对啊,但如果机器也参与了证明呢?

这就是计算机辅助证明,虽然稀少,却也存在。最有名的例子就是1976年美国数学家阿佩尔和哈肯对四色定理的证明。

法国大区的四色染色,图片来自Wikipedia

法国大区的四色染色,图片来自Wikipedia

四色定理,说的是任何地图都能用四种颜色涂抹,使得相邻的区域颜色不同。这个陈述看起来人畜无害,似乎不难解决,而许多知名的数学家也被它的外表迷惑,比如闵可夫斯基就曾在课堂上夸下海口,一边说这个问题没被证明只是因为没有一流数学家去做,一边就在黑板上开始推导,推了一节又一节课,最终只能食言。当然,哥德巴赫猜想和费马大定理看起来也人畜无害,这也不妨碍它们难倒一大片顶尖数学家。但与两者不同的是,四色定理的证明很难说是重大突破。它属于组合数学,但这个领域因为着眼点相当分散,能统领一大片不同课题的体系少之又少。

阿佩尔和哈肯的证明被历史记住,主要因为这是第一个计算机辅助完成的重大证明。他们的证明基于所谓的“放电法”。首先,他们利用计算机,设计了一些“放电规则”,这些规则能用于证明任意的平面地图必然包含1936种构型之一。这1936种构型,又被称为放电规则对应的“不可避免构型集”。然后,他们利用计算机证明了,所有这1936个构型都是可以约化的。也就是说,所有平面地图都能被约化,变成区域数更少的平面地图,而小地图能用四色染色,当且仅当大地图同样如此。如果存在不能用四色染色的平面地图,取这种地图中区域数最少的地图,通过约化,能导出区域数更少但同样无法用四色染色的地图,引发矛盾。阿佩尔和哈肯就是这样,证明了四色定理。

但这篇论文却让想要验证的数学家犯了难。论文由两种截然不同的体裁合成:数学家熟悉的人工证明,还有计算机熟悉的计算过程。人工证明虽然繁复,但还在数学家熟悉的范畴里。但计算机的计算过程应该怎么验证呢?

虽然具体的算法属于人工证明的部分,但机器毕竟不认识算法,它只认识能执行的代码,所以还要验证具体的算法实现代码是否正确。而从代码到具体的运算结果,又是另一回事,虽然原则上可以逐一验证,但长度实在超出了人类能接受的范畴。但不去验证具体的计算,又如何能确定所有结果都准确无误?也许有些编写上的细节没有注意到,或者当时计算的硬件有问题?

所以这个证明的验证,花了很长时间。

验证所有构型都能被约化的部分相对简单。虽然计算量大,但这主要用于寻找具体的约化方法,验证约化成立倒是不费多大功夫。为了检查,可以重新由不同的人在不同的硬件上用不同的语言重新编写这部分的代码,然后进行计算。一次计算可能有问题,但两次细节完全不同的计算同时出错的可能性就低得多。

问题是验证放电规则和不可避免构型集。计算部分由电脑完成,但验证却必须手工进行。如此庞大的证明,一开始有漏洞几乎是必然的。在几年后,德国的一位硕士生检验了整个证明的40%,发现在放电规则中有一个严重错误。其他人也陆续发现了一些小问题。阿佩尔和哈肯花了不少时间处理这些问题,最后出版了一本专著,共计七百多页。随后,许多数学家陆续尝试简化这个证明,提出了许多不同的证明。虽然这些证明都需要计算机的辅助,但毕竟这么多独立证明全都出错的可能性很小,大家也就都接受了四色定理。

另一个受到类似“礼遇”的,是托马斯·黑尔斯(Thomas Hales)对开普勒猜想的证明。他证明的是,在三维空间中堆砌大小相同的小球时,最密集的方式是面心立方和六方最密堆积。

两种最密堆积,图片来自Wikipedia

两种最密堆积,图片来自Wikipedia

黑尔斯的证明可谓暴力穷举的典范。他利用计算机,将所有可能的情况一一分类,总数超过五千,然后利用计算机算法逐一否定这些可能性,这需要解开共计约十万个线性规划问题。如果没有计算机,这恐怕是不可能完成的任务。证据就是,最终证明共计250页,却还要外加3GB的计算机程序和数据。

由于开普勒猜想的重要性,黑尔斯的证明也相当引人注目。他将论文投到了数学界的顶级期刊《数学年鉴》(Annals of Mathematics)。在数学界,只要你说出Annals这个词,人人都知道你指的是《数学年鉴》。编辑部自然也不敢怠慢,毕竟这是个长久悬而未决的猜想,而计算机在证明中的角色无比重要,编辑也希望能完全确认计算正确性。他们组织了一个12人委员会来审查这篇文章,只有12个人意见完全一致,这篇文章才算通过。为了详细验证整个证明的正确性,有些委员还在自己的实验室里召开了研讨班,准备细细检查证明的方方面面。

委员会花了4年,结论是他们“99%确定”证明是正确的。他们虽然完成了大部分证明的检查,但仍未到彻底的地步。以数学家的标准来说,这还是不太令人满意,但证明太长太麻烦,委员们实在干不动了。最后,《数学年鉴》发表了这篇审稿标准史无前例,审稿结果也史无前例的文章。

这些计算机辅助证明,即使计算机只起到了辅助计算的作用,也足以让希望确认证明正误的数学家烦恼不已。这么长的计算,人花一辈子也不可能完全验证,怎么才能确定计算没有出错?

既然人不能验证,那么机器怎么样?

只要将证明完全形式化,写成机器能明白的格式,那么就可以让机器去验证整个证明。好在验证总不会比计算难,既然机器能完成计算,那么也能完成证明。于是,要确认形式化证明的正确性,只需要先让机器去验证,然后人工检查机器验证代码的正确性。这样的代码通常很短,而且可以用于许多证明,可以说用力少而建功多。

问题在于,证明的精华部分是由人类完成的,而人类的语言机器显然读不懂。要想让机器验证证明,就要把这部分完全形式化。这是个艰巨的工作。

对于四色定理和开普勒猜想的证明,因为它们非常重要,所以即使明知很难,数学家还是去做了。2005年,Werner和Gonthier给出了四色定理的一个完全形式化的证明,并用软件Coq完成了验证。从2003年开始,黑尔斯开始了一个合作项目Flyspeck,旨在将他自己的证明完全形式化,然后用机器来检验,从而确立证明的正确性。与21位合作者花了十一年多的时间,他终于完成这个项目,而现在开普勒猜想已被公认获得证明。(关于形式证明,请参见木遥的《形式证明:机器的光荣与人的梦想》

所以说,即使读不懂,还是有办法审稿。当然,需要如此大费周章的论文少之又少,也只有非常重要的论文才会获得这种待遇。但数学家对证明正确性的执着,由此可见一斑。

但对很多数学家来说,知道一个证明站得住脚还不够,他们希望能*理解*整个证明。对于四色定理和开普勒猜想的证明,他们也许会说:“好,我知道那是对的,但它*为什么*对?”

这种对理解的渴求,也是推动数学前进的动力。数学家追求证明,但从来不单追求证明。他们的真正目的,是通过证明去理解为什么这个定理是对的,为什么那个理论要以如此方式建立。机器证明也是数学,但谈不上是好的数学,或者更准确地说,谈不上是美妙的数学。

也许终有一天,人工智能也会懂得做数学,它们也许会拥有能大幅抛离我们的能力。就像姜峯楠(Ted Chiang)的短篇科幻《人类科学之演化》(The Evolution of Human Science,首发于《自然》期刊)那样,也许有一天,人工智能做的数学会达到人类无法理解的地步,仅仅皮毛也足以让人类最顶尖的数学家钻研一生。当然,原著中拥有超人能力的并非人工智能,而是植入芯片的人类,但道理是一样的。

然而,即使人工智能超越了我们,对数学的理解以及它给我们带来的美感也不会消失。我们做数学,为的不仅是追求真理,还为了理解这些真理。

而望月新一的证明,只是历史长河中前仆后继的又一步。

后记

我一直觉得,写这篇文章的不应该是我。我做的是组合数学,对于代数几何所知甚少,写关于望月新一的文章,简直是赶鸭子上架。

但了解更多的人在哪里?

比我更懂的人肯定多得是。任何一个做代数几何的博士生,肯定都比我更适合写这篇文章。但似乎没有听见他们的声音。

我理解他们。这毕竟是一个高度抽象的学科,要向研究方向不同的同事解释尚且很有难度,更何况向一般人解释?

这也许也是望月新一拒绝媒体的理由。媒体肯定不懂他的理论,只知道这可能是一个重大突破,可以搞个大新闻。但这些媒体何尝愿意了解他的理论?写成报道,焦点多半在个人的私生活上,要么就是各种八卦。看的人是很多,但看完之后,给人们又留下了什么教益?

但这个事情毕竟不能不做。正如他的新理论也需要知音来帮助宣讲,数学本身也要靠科普才能传播,人们才会认识到数学的重要性,而不是问出“微积分有什么用,又不能买菜”这种问题。怀有恶意的媒体固然会断章取义,但让更多人更了解数学的美妙也是件好事,值得再三权衡。

这篇文章,由于本人知识所限,难免有许多疏漏,权当抛砖引玉。希望与远阿贝尔几何关系更密切的专业人士,能写出更深入准确的文章,让大家分享数学最前沿的这一大事。

本文删减版曾发布于果壳网,地址在这里

参考文献

Ivan Fesenko, Fukugen, Inference Review, http://inference-review.com/article/fukugen

Mochizuki Shinichi, Inter-universal Teichmuller Theory I: Construction of Hodge Theaters, http://www.kurims.kyoto-u.ac.jp/~motizuki/Inter-universal%20Teichmuller%20Theory%20I.pdf

Mochizuki Shinichi, The Mathematics of Mutually Alien Copies: From Gaussian Integrals to Inter-universal Teichmüller Theory, http://www.kurims.kyoto-u.ac.jp/~motizuki/Alien%20Copies,%20Gaussians,%20and%20Inter-universal%20Teichmuller%20Theory.pdf

]]>
http://songshuhui.net/archives/101102/feed 6
数学概念是真实存在的,还是被人们创造出来的? http://songshuhui.net/archives/100272 http://songshuhui.net/archives/100272#comments Sun, 04 Mar 2018 06:01:05 +0000 http://songshuhui.net/?p=100272 在数学中,有很多不符合直觉,但却经常出现的东西,比如说虚数。因为不符合直觉,所以有些对数学不太了解的人,就会有这样的疑问:这些数学对象真的存在吗?

这其实牵涉到了一个相当深刻的数学哲学问题:数学对象到底是什么?

这个问题自然见仁见智,但我可以讲一下我自己的观点,相信也跟相当一部分数学家的观点一致。

一言以蔽之:两者都是,取决于你的视角。

举一个例子,一幅油画,它里面画的东西是真实存在的,还是画家创造出来的?

你大概会说,这当然是画家创造出来的,毕竟画里边画什么都可以,写实的风景可以,印象派的也可以,荒诞不经的也可以,甚至完全抽象的东西也可以。画里边的东西,在现实世界不一定存在,它们除了是画家创造出来,还能是什么呢?

但从另一个方向来说的话,画里边的东西,作为画的一部分,似乎也是真实存在的。比如梵高《星夜》中的星空,在现实中当然不存在,但你要是跟别人提起《星夜》这幅画,大家都会想起其中星空的模样。所以,要说《星夜》中的星空并非实在,好像也说不过去。另外,《星夜》中的星空虽然是虚构,但至少也是从现实的基础上升华而来,刻画了现实星空的某些方面。在这种意义上,《星夜》中的星空更加有了一点实在的味道。

梵高的《星夜》,图片来自Wikipedia

梵高的《星夜》,图片来自Wikipedia

数学也是如此。

与大部分人类活动的结晶一样,数学也是人构建的。许多数学理论,尤其是最前沿最抽象的那些,都很难说是直接描绘了现实中的什么东西。克罗内克说过:“上帝创造了自然数,其余一切都是人类的造物。”这就将这个方向的观点推到了极致。我们甚至可以说,连自然数也只是人类为了方便的创造出来的概念。三个苹果是存在的,三道门也可以存在,但“三”这个概念,脱离了实际的物质,是否还是真实存在呢?这就是一个很大的疑问。

但数学概念,作为人类活动的结晶,无疑是存在的,只不过不是什么看得见摸得着的东西,而是作为一种思想而存在。还是拿“三”这个概念做例子,应该没什么人会否认这个概念的存在,因为我们天天都在用这个概念。但即使作为一种思想,数学概念也有现实的部分,因为很多数学来源于生活。是因为有了三个苹果,有了三道门,所有这些真实存在的事物,才让我们提出了“三”这个概念。“三”,实际上刻画了现实的一个侧面,所以它是现实的一种抽象和延伸。

一切数学概念,都可以用这种眼光去看待。即使有一些数学概念看起来非常复杂抽象,但定义它的人必定有他的需要,而这种概念必定具有某种逻辑必然性,所以才会让别人想到要定义它。

现在重新举复数的例子。课本上定义虚数i就是满足i*i=-1的数,然后以此为依据构建出复数。你也许会觉得,这好像没有逻辑,不是在乱来么?这是因为课本只能讲大部分人能理解的内容。实际上,复数有其逻辑必然性,它是我们想要解方程的结果。实系数方程在实数内不一定有解,但我们可以证明,所有实系数方程在复数内必定有解。也就是说,复数是实数的一种延伸,使得我们可以在上面解任意的方程。我们可以证明,复数是所有这些延伸之中最简单的一种,这就是复数的逻辑必然性,用数学的术语来说,就是复数域是实数域的代数闭包。所以,定义复数是有理由的。另外的理由,就是复数的确在现实中出现了。电磁学中,利用复数能更好地描述电磁波的传播,而在量子力学中,波函数甚至只能利用复数来描述。所以,复数的确也描述了现实的某些侧面。

是的,复数是人类提出的概念,但难道它作为一个概念就并非真实存在,难道它之中就没有一点现实的成分吗?我想未必。

一切数学概念也是如此。它们是人创造的,但也描绘了现实的某些方面,具有逻辑上的必然性,而作为概念,它们必然真实存在。

本文系悟空问答签约稿件,未经书面许可不得进行商业转载

]]>
http://songshuhui.net/archives/100272/feed 3