首页 >> 计算机科学 >> 文章

开篇


假设你有写日记的习惯。从五岁开始,把每天浓缩成两千字,一直写到一百零五岁。那么,你一共写了七千三百万字,相当于一百部《红楼梦》。

这样,一万三千个你的一生,也只不过刚好能填满薄薄一片存储器,它只有指甲盖大小,只有半克重,一旦丢失,就可能再也找不到。如果有人想要在一百年内读完这块小小存储器中的文字,他需要不眠不休,并且每秒钟扫过三百字才行。

我们用一个更轻飘飘的单位来描述它,说它容量2TB。这个个位数的描述,却意味着五十万首MP3歌曲,或者七十七部高清蓝光电影,亦或者六十七万张一千万像素照片。这是五百年前最博学多识者也无法想象的庞大信息量,现在却能闲闲放在我们的指尖,一不小心就会乘风飞去。

在这片数年之内即会面世的存储装置面前,浩如烟海不过是往事,汗牛充栋早已成笑谈。它足以记录一个人毕生的所学所想,并可以容易地传诸后世。

人们一直试图为后人留下些记忆,而从公元前一万五千年的岩洞壁画开始,这种设想才逐渐成真。文字的发明是一大革命,它让人们可以将自己的经验与知识简单方便而明确地放在身外,让它有机会一代代传承。岩石、金属、泥陶、骨骼、皮革、布帛、竹木都曾被用于记忆的传递更替,而人们也一直在寻找更轻更快更好的载体,能够将所有在险恶生涯中艰难累积的智慧记录下来,不致遗失。

从纸张、印刷术到磁、光、半导体存储设备,存储密度变得越来越高,存储设备也越来越复杂。今天的人们可以以很少的代价,将自己的记忆完全交给这些不会忘记的金属、半导体和塑料,解放自己的大脑,让它去做更擅长的工作。无论是对机器还是对人来说,这可能都是最好的分工。

2010年10月,西部数据公司的执行副总裁Jim Welsh谈到,到2014年,每户家庭平均会存储1TB的数字内容,而迄今已有近六十年历史的硬盘,依然将会是最主流的存储设备。人们依然会对云存储心怀疑虑,毕竟它看起来并不如手边的硬盘看起来可靠和安全。而随着带宽的迅速增长,使用者对光盘这类存储介质的需求会下降,下载的便利性让DVD和其他光存储设备的价值逐渐趋近于零。

这也许只是一家之言罢了,毕竟这种论调出自世界上最大的硬盘生产商之一。只有一件事可以确定,就是我们永远需要更多的存储空间。Gartner咨询公司认为,世界上数据存储量正在以每年40%的速度递增,几乎每两年就会翻一倍。这又是一个相互纠缠而发展的范例:当我们拥有更多存储设备的时候,就会发现有更多的内容需要存储;而这又使得我们不得不添置更多存储设备。这像是一条不归路,而也许正是进步所必须付出的代价。

虽然今天的存储设备已经能够达到惊人的效率,但是人们仍不满足。研究者们依然为更高的存储密度、更低的能耗而努力,试图创造出堪称完美的存储设备。它应该容量巨大,应该体积微小,应该成本低廉,应该访问迅速,应该能够长久保存,甚至直到世界末日来临的那一天。当这种介质被发明出来的那天,也就意味着人类的群体记忆,将会与人类这个物种延续最少同样长的时间。

在这系列文章中,我将会和大家一起回溯历史,回顾我们将记忆逐渐从脑中剥离的历程。我们会看到历史上曾经出现过一些存储手段,从古老而原始的刻木、结绳记事,到纸张和计算机的冲突,再到那些以今天的眼光看起来笨重得可笑的早期设备。我们会看到那些存放于身外的记忆,犹如一个动作迟缓的婴儿般蹒跚学步,直到突然以迅雷不及掩耳之势放足狂奔,成为我们生活中不可或缺的成员,并且裹挟着我们轰然前行。

当然,伴随着这一路历程的,是那些改变了我们生活的人们。他们以天才的想法和不屈的努力为起点,以痛苦失落和奋力挣扎为代价,改变了世界的面貌,成就了今天日常生活的基础,让我们受益无穷。我打算写下这些文字,只是因为他们的故事值得被阅读。

那么,让我们开始吧。

在西高峰的近旁,有一具已经风干冻僵的豹子的尸体。豹子到这样高寒的地方来寻找什么,没有人做过解释。
——欧内斯特·海明威,《乞力马扎罗的雪》

尔塞利诺·桑托拉,1831年出生于西班牙的圣米盖尔,毕业于马德里大学法律系,是一位博学的考古爱好者,生活充实而富足。1875年,一位牧羊人告诉他,在他家族拥有的阿尔塔米拉牧场上,发现了一个岩洞,似乎有人生活过的痕迹。这位考古爱好者自然不会放过这样的机会,他兴冲冲地前往,第一次考察就找到了一些小件文物。但是他也没有把这件事太放在心上。直到在1878年的巴黎世界博览会上,他发现法国南部的一些文物与他找到的文物十分相似,才重新产生了考察的兴趣。1879年,他带着九岁的女儿玛利亚重返故地,再次钻进这个石灰岩洞穴中。

在颤动的蜡烛光下,眼尖的小女孩发现了岩壁天顶上巨大绘画。桑托拉在被震撼之余,很快从马德里大学请来考古学家比拉诺瓦·彼拉,合作对这个洞穴做了深入调查。他们一致认为这应该是旧石器时代的绘画,并且在1880年里斯本的一次国际考古学会议上,发表了调查报告《桑坦德省史前文物调查笔记》。

然而,这项发现并没有获得应有的重视。当时的主流学界并不认同他的发现,欧洲人类学和考古学的领袖人物,法国科学家加布里埃尔·莫尔蒂耶和埃米尔·卡太海克认为,旧石器时期的人类不可能拥有如此高超的绘画技艺,认为这些应该是现代人的手笔,认为是桑托拉伪造了这一现场以骗取名誉。在这样的舆论背景下,当时的学界甚至不肯派出考察人员去实地考察一下。1888年,桑托拉去世,一直到他去世的时候,还被认定是一个可耻的造假者。

进入二十世纪,更多的有史前壁画的洞穴被发现。直到1902年,人们才确认了这处壁画的真实性。卡太海克考察了阿尔塔米拉洞穴,并且向玛丽亚保证,一定恢复她父亲的名誉。他发表了著名的《一个怀疑主义者的忏悔》论文,公开承认他先前犯的错误。桑托拉和他女儿的发现终于获得了肯定。

阿尔塔米拉洞穴中的绘画,是用坚硬的石头刻出了浅浅的轮廓,再用木炭、赭石,以及混合动物血和脂肪的颜料涂抹而成。这里一共有超过150幅壁画,被画下的形象包括野牛、野马、野猪、羊和鹿等等,造型真实而优美。这些被叫做克罗马农人的晚期智人在一万多年前像是突然之间达到了一个艺术高峰,至今在考古学上依然没有发现任何先兆,就像是突然插进了历史旋律的一记强音,又突然消失。许多在这些壁画中使用的技法,如透视画法、动态感等等,一直到万年之后的文艺复兴时代,才又被重新发明出来。

现在,这个洞穴已经成为了世界文化遗产,受到严密的保护。那些身处冰河时期的人们当然不会意识到,他们的后代会把这处他们栖身的洞穴视为人类艺术的起点,也是人类知识传承的开端。

然而,这些壁画到底有什么作用,人们还只能猜测。我们只能从这些绘画中看到,那个时期的人类与野兽们共同生活的记忆,他们彼此围猎、追逐、搏斗和残杀。当夜幕来临,人类回到他们栖息的洞穴,用手边随手可得的原料,默默地记录起那些惊险、勇敢、生存的快乐,以及死亡的伤痛。

他们选在了在当时唯一可以选择的表达方式来记录他们的记忆和感情,这种方式不需要任何解释,就可以跨越种族的隔阂。这些史前人类以他们能想到的最直接的方式记录下他们的生活,这些洞穴里的绘画也许是当时人类的历史,也是他们的生存的记忆与信仰。他们使用木炭和颜料来记录的内容,与今天我们藉由现代存储设备保存的东西,并没有本质上的区别。只是,他们的这些绘画保存了上万年之久,而直到今天,还没有任何人工制造的存储设备能与之比肩。

纸张,不过能保存百年而已。软盘只不过能保存几年,光盘的有效期也只有十几年。一次摔落就可能对硬盘中的数据造成破坏,即使是全固体的半导体存储器,也只能保证数十年的记忆。

而更重要的,是这些记录设备都需要相应的读取装置;就连纸张上的文字,也需要最合适的解读。而最反讽的是,获取读取装置的方法,却刚好被存放在这些记录设备当中,就像是将保险箱钥匙锁进保险箱一样无解。

当另一种生物成为这个蓝色星球上的主宰者的的时候,也许阿尔塔米拉洞穴的壁画会依然留存,但是现代人类文明的记录,或许已经丢失殆尽,或许再也不会被解读出来。

也许正像科幻作家刘慈欣在《三体:死神永生》中所写到的那样,要将记忆保留下来,最好的办法是把它们刻在石头上,深深地刻进去。

(待续 本文删节版已发表于《电脑报》)

0
为您推荐

55 Responses to “记忆传承,信息永生(一)”

  1. 837974391说道:

    很有趣,但错词错字不少,比如“他发飙了著名的《一个怀疑主义者的忏悔》论文”这句话让我很是苦恼~

  2. hoplite说道:

    计算了一下确实是2TB没错,2TB的闪存盘面世了吗?放在手指尖上指甲盖大小的?

    • zz说道:

      这是microSDXC卡,跟现在手机用的TF卡一样大小。

    • adede说道:

      64片32GB的TF卡叠成一堆,不过6、7厘米那么高..手不抖的也能放在指尖上

  3. 九千澜说道:

    据说一个人类的大脑记忆只有相当于不到40Gb的数据。

    • aa12说道:

      人类大脑通过记忆获得的思考回路和信息处理能力是不能用容量来衡量的……
      你听说过FPGA"空间1MB“这样的说法么?虽然门的数量有限,但那不是存储空间
      但是人类的思维能力却有一大部分是通过学习得来的……实在是难以量化

      • 九千澜说道:

        反正你的海马体只占大脑总重量的1/80左右,如果有幸能长得大一点你就可以多记住一点东西。
        我可不赞同把那玩意当成以逻辑和数学方式计算的电路。

        • aa12说道:

          别忘了,HM仍然能学会新技能……

        • aa12说道:

          所以我认为大脑可以通过学习来形成新的思考回路……就好比FPGA自己给自己刷程序……

        • 圣堂巫师说道:

          海马负责加工记忆信息,但记忆内容不是长期储存在这里。

  4. 全唐人狂朝说道:

    最为一个管理5T多硬盘的人表示文章实在是不错!!!

  5. SDXC说道:

    的确,是2TB
    第三代SD卡SDXC已经有2TB的MicroSD(TF)了
    只不过暂时没面向市场
    再等几年,我们就可以在电脑城/摄影器材店随便买到了~

  6. 孤竹牧狼人说道:

    猛犸老师好久没有出手了。。。
    好文~

  7. 草原狼说道:

    看到这个图浑身发冷。。。突然想起了“空手指”

  8. meme说道:

    给我传承个写轮眼吧

  9. firstrose说道:

    锁进 保险样 一样无解

  10. 君美异说道:

    电子产品不可靠啊,还是纸的比较可靠

  11. jamesr说道:

    只恨光媒介容量不够大,硬盘还是没有光盘可靠。

  12. 音乐养生说道:

    还是直接刻在石头上,保存的时间最长。。。

  13. stark说道:

    最可靠的是石头

  14. 春歌的猫说道:

    2T应该有硬盘吧

  15. 回锅肉说道:

    文章开头的三个数字:一百零五、七千三百万、一万三千虽然是为了凑后面的2TB,但是这三个毫无任何意义的数据连用感觉很别扭呢……

  16. en说道:

    有一部BBC(or探索频道)的片子,讲人类毁灭后1万年内发生的各种变化,在影片中罗列各种人类灭绝后,保持时间最长的信息储存介质中,光盘磁盘是最糟糕的,保持时间比纸张还短。而石头则是保持时间最长的介质。这让我想到,如果存在过史前文明,那么他们能留到现在的也就都是石刻和一些破罐子罢了。

  17. 泡泡雪说道:

    看到开头的时候就想到了大刘书里说的刻在石头上,居然在结尾看到了。。。

  18. linecong说道:

    拜三体!

  19. pioneer说道:

    好文章,赞!

  20. nail说道:

    期待啊

  21. [...] 上篇请见 记忆传承,信息永生(一) [...]

  22. [...] 本系列前文参见: 记忆传承,信息永生(一) [...]

  23. 乱跑说道:

    如果有部科幻片,开头是,在公元XXXX年,因为一种病毒的产生,所有的数字存储设备全部被销毁了

  24. [...] 本系列前文参见:记忆传承,信息永生(一) [...]

  25. 肖均说道:

    只有互联网能彻底改变中国和世界!

  26. ffdemon说道:

    好文章,非常喜欢

  27. ffdemon说道:

    好文章,非常喜欢!!

  28. 香烟烤肺说道:

    电子数据必定是经过一个编解码的过程的;谁能保证你用WORD写的信息在经过1000万年后还有另外一个人能够用word进行阅读呢。
    他们能看到的不过就是0101001。
    计算机从最初到现在才多久?最开始的那些纸卡,现在有几个人能够把里面的数据阅读出来呢?

  29. 香烟烤肺说道:

    即使是刻在石头上的图画;如果千万年后的“人”类没有“眼睛”;那么和一个空空的石壁有多少区别呢?

  30. yangbo说道:

    非常好!

  31. 分形艺术说道:

    非常棒!!!

  32. 双龙说道:

    我觉得最原始的存储设备是:基因
    另外极赞:
    “他们使用木炭和颜料来记录的内容,与今天我们藉由现代存储设备保存的东西,并没有本质上的区别。只是,他们的这些绘画保存了上万年之久,而直到今天,还没有任何人工制造的存储设备能与之比肩。”

  33. 双龙说道:

    我觉得最原始的存储设备是:基因

    • 比尔盖子说道:

      给你和大家一段摘录于《数据之美》中DNA与计算机数据的资料:

      癌症是一种由于细胞增生失控而产生的疾病。一个细胞的生长和位置是由他的基因控制的,也就是说,它只会以可控的方式分裂。除此之外,人类基因组中包含了很多肿瘤抑制基因,它们可以在细胞不受增生控制的时候使细胞消亡。那么癌症是怎么发生的呢?答案就在数据库损坏中。化学致癌物(比如香烟中的),辐射和病毒都能都使你的DNA产生变化。

      当计算机硬盘碰到小损坏的时候,你可能注意不到有什么不同。不过当一定数量的损坏不断积累,程序就会开始崩溃,文件就打不开了。基因组同样如此。损坏足够多之后,基因的控制会产生紊乱,导致不正常的表达发生。如果你能触及正确的基因,那么细胞会开始向他自己发送生长和分裂的信号。其他的基因(比如肿瘤抑制基因)可以完全被关闭,一旦如此,你便在一步步走向癌症。

      当然,硬盘在大多数情况下是可靠的。大多数硬盘中都有专门的系统来检测和重映射坏道。硬盘中也包含了检测磁盘损伤并通知用户的系统(比如SMART监控)。为了获得额外的可靠性,你可以通过RAID1阵列(请参考维基百科:RAID)来将两个硬盘互相镜像。这样,两个硬盘的内容是相同的,如果一个硬盘出现错误,另一个硬盘便可以替代它并恢复数据。细胞自身也有监测和修复DNA损伤的机制。让我们来回忆一下,DNA分子以双螺旋的形式存在,一条链上的碱基与另一条链上的碱基的对应碱基互补配对。如果一条链发生损伤,它可以通过另一条链作为模板进行修复(类似硬盘的RAID1方式。比尔盖子加:DNA是双螺旋,如果是三螺旋,其实更像RAID5,因为DNA不是互相镜像的。RAID5也不是互相镜像,而是靠三块硬盘上的奇偶校验码)。对于更大损伤的修复,还可以采用其他机制。

      如果损伤不能修复,肿瘤凋亡基因就会启动,阻止细胞分裂并最终导致细胞程序性死亡,在理想的情况下,DNA受到损伤的细胞可以得到修复,类似硬盘SMART机制。涉足于计算机集群(比方说5 000个硬盘的规模)的人都会知道硬盘故障是多么频发。想想人体内有100万亿个细胞,他们大概会奇怪为什么癌症的发病率会比较低。

      复制

      前文中已经说到,DNA是由缠绕在一起的两条链构成的。两条链是互补的:DNA的四种碱基都有对应的互补碱基(A和G互补,C和T互补),互补碱基出现在互补链的相同位置。沃森和克里克在他们揭示DNA结构的论文中有一段著名的论述:“我们注意到我们的碱基互补配对假说直接给出了一种可行的基因物质复制机制。”

      每一个DNA链都可以用作另一个链的模板,用以复制DNA双螺旋。细胞可以分离两条链,将它们分别作为模板,用互补碱基制造新链。在细胞分裂为两个新细胞时,上述过程就会发生。

      破解基因密码

      假设未来文明出土了一块21世纪的硬盘。即使未来的人能都理解文件系统,文本文件在硬盘上最终还是以二进制形式存储的。如果没有7bit(比特)数据转换成为一个字母的7bit ASCII码表,信息就会无法解读。

      1961年,克里克和布伦纳开始了基因中类似的编码逆向工程。ASCII将二进制转换为90个左右的字符,每个字符必须7个比特,即2^7=128(实际上还有一位用于奇偶检验)。在DNA中,四进制的碱基代码需要编码21个字母(20个氨基酸和一个终止信号),那么每个字符就需要3个碱基(4^3=64)。

      举例来说,三个碱基ACT编码了氨基酸。当翻译机器在基因中遇到ACT三联密码子时,就会向制造中的蛋白质分子插入一个苏氨酸。我们可以注意到,密码子的数量(64)比信号(20个氨基酸和一个终止信号)要多。这意味着三联密码子内建有的冗余机制——大多的氨基酸有不止一个密码子编码。

      实际上,对大多数密码子来说,最后一个碱基对编码没有影响或者影响很小。这使得碱基突变(碱基的变化,比如A变为T)对蛋白质造成影响的可能性变得尽可能低,也就保护了蛋白质结构免受可能的碱基损伤影响。

      人类基因组在有意外错误并入的情况下已经成长了几十亿年了。因此,基因组中充满了没有作用功能的元素以及那些作用功能不明确的元素。虽然“垃圾DNA”这个说法已经不再流行了,但是不可否认的是,DNA中大量信息的存在仅仅是因为将它们移出基因组的选择性压力太小了或者根本不存在。

      有些元素可以自行在基因组中复制、粘贴。例如Alu元素,一种大约有300个碱基的碎片,其中包含的信息可以将它自己复制为RNA(氧核糖核酸,一种寿命短一些的类DNA分子),然后在其他位置重新复制进入基因组。这样的结果就好像让库布里克(Stanley Kubrick)的《The Shining》中的人物杰克和你一起写这本书,书中写着“只工作,不玩耍,聪明杰克也变傻”。Alu元素占到了人类基因组的10%。简单生命体基因组的大小限制了那些元素的增殖,人类基因组中这些元素的存在也就使得人类基因组更为深奥难懂了。

      DNA作为数据源

      用编程语言来说,DNA就是一个字符串:
      char(3*10^6) human_gnome;

      人类的完整基因由30亿字符组成,即使在最没效率的自制编程语言中也可以很轻松的处理。但是确定这30亿个碱基的确切顺序需要化学、生物信息学和实验室过程的通力合作,当然还需要许多旋转的磁盘。

  34. zhongyibei2008说道:

    我很喜欢看下面的评论。

  35. 到此一游说道:

    史前的猛犸恐怕不止4s

Leave a Reply for 泡泡雪