首页 >> 八卦 >> 生物 >> 文章

虽然早在1953年,Watson & Crick就发现了不朽的DNA(脱氧核糖核酸)双螺旋结构,但是长久以来,人们始终都找不到很好的办法测定DNA中四种碱基——A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)——的排列顺序。如果说DNA是藏有生命遗传密码的天书的话,那么若是连构成密码的这4个基本字母都不能识别,人们就永远没有机会破解生命的遗传密码、解读生命的奥秘。

这种窘境直到一位名叫Frederick Sanger的大牛发力才得以打破。

DNA测序时代开始

Sanger头像

说起这个Sanger君,早就是牛的不得了的人物了。早在1955年,他就发明了一种通过电泳鉴定蛋白质结构的方法,并且因此单独获得了1958年的诺贝尔化学奖。
到了1975年,双螺旋结构发现20余年后,Sanger君又发明了一种称为“链终止法”的方法来测定DNA的序列。

测量DNA的序列,就像搞清楚一条铁链每一环的顺序一样,我们可以先将铁链按照1节、3节、5节。。。。。。13节、15节。。。。。。。167节、 169节等等不等长的顺序截断,这样我们根据断链的长度就可以知道断链的先后顺序,然后用同样的方法把较长的断链的顺序搞明白。可是打断铁链容易,准确截断DNA则不是那么容易的事情。而“链终止法”,又叫“Sanger法”,就是一种通过准确的截断铁链上某种特定类型的环来测量DNA序列的方法。

我们知道DNA的信息是由ATCG四种碱基书写的,由于DNA的双链结构,每个碱基都以A-T、G-C的配对方式和对应的碱基形成一个碱基对,即1个 bp(base pair),1bp可以理解为DNA天书上的一个字节。在DNA复制的过程中,原来的DNA链作为“模板”,通过A-T、G-C的碱基配对方式合成新的 DNA单链。而合成新DNA的原料就是dNTP(N代表A、T、G、C),称为脱氧三磷酸X苷(X代表与A、T、G、C相对应的腺、胸腺、鸟、胞)。 Sanger通过在dNTP身上做手脚,使得DNA复制时,做过手脚的‘dNTP’(ddNTP,双脱氧三磷酸X苷)和模板的碱基配对以后,复制即停止。如此一来,新合成的DNA单链即变成在不同位置终止的残缺片段。这些片段因为长度不同而拥有不同的分子量,通过电泳的方法即可轻易的被分开。

DNA复制

例如,假设有一段20个碱基(bp)的DNA片段,科学家想要测定这段DNA的序列。那么,在复制这一段DNA的时候,加入正常dNTP作为原料的同时,再加入一些做过手脚的ddTTP。如果ddTTP和第二个位点的腺嘌呤(A)结合,那么合成过程就会在这个位点终止,新合成的DNA链只有2个bp,相对分子量就是2。如果ddTTP和第八个位点的腺嘌呤(A)结合,那么新合成的DNA有8个bp,相对分子量就是8。随后通过化学方法将这些完整的、不完整的DNA链解开,用电泳的方法把这些DNA链按不同的分子量分开,我们就能看到,最后产生了一些相对分子量分别为2(在第二个位点和模板结合的 ddTTP)、8(在第八个位点和模板结合的ddTTP)以及20(完整的DNA片段)的DNA单链。由于DNA的复制只能按由5'端到3'端的方向进行,那么通过这种方法,我们就能推测出,这段DNA从5'端开始的第一位和第八位的碱基都是腺嘌呤(A)。

DNA电泳

如此再根据互补原则,分别加入动过手脚的ddATP、ddCTP、ddGTP,即可依次测出这段DNA的T、G、C碱基的位置。如此就能测出这段DNA完整的碱基序列。Sanger成功的用这种方法测出了一些碱基对数目很小的病毒DNA的。他也凭此项发明获得了1980年的诺贝尔化学奖,至此,Sanger君成为目前世界上唯一一位获得过两次诺贝尔化学奖的科学家。

但即使是如Frederick Sanger这般独此一家,别无分号的大牛人也有解决不了的问题。

Sanger法的缺陷在于:
1.只能测定病毒等碱基数目较小的DNA,无法应付如人类这般成千上百万碱基对构成的DNA。
2.测定碱基序列需要大量完全相同的DNA拷贝,即必须将要测定的DNA复制很多倍以后才能进行测定。一般的样本很难满足其DNA数量上的要求。

因此,科学家们能测定的DNA碱基(300~500bp)序列的长度非常有限,对稍大的DNA完全束手无策。好在不久之后,科学家们即在大肠杆菌(E. coli)中发现的一种特殊的限制性内切酶,具有能将特定序列的DNA切成小片段的特性。这种叫做EcoRI(英文全称)的酶,帮科学家们解决了 Sanger法的第一个难题,即使再大的DNA分子,也能通过限制性内切酶切割成小片段进行测序。

EcoRI切断部

同样,EcoRI对于解决第二个难题,即DNA数量上的不足,也有很大的帮助。EcoRI切下的DNA小片段的断端具有粘性,如果用同样的酶把酵母菌(或细菌)的DNA也切开,这些需要研究的小片段就能与酵母菌DNA的断端粘在一起,然后重新闭合。如此,被切开的DNA片段就被插入到酵母的DNA中去了。这个就叫做“基因重组”。由于酵母DNA分裂复制的速度非常快,这些被插入的片段也能一起被快速的复制。这个过程称为“克隆扩增”。当达到需要的拷贝数时,研究者则通过EcoRI再把需要的片段切下来用。

由于EcoRI的发现,解决了基因测序上的多个难题,限制性内切酶的发现者,Werner Arber, Daniel Nathans, 和Hamilton Smith共同获得了1978年的诺贝尔医学和生理学奖的殊荣。

Werner Arber

Daniel Nathans

Hamilton Smith

同样是诺贝尔奖,有些人要3个才能合拿一个,有的一个人就能拿两个奖,可见大牛们也是分等级的。

于是通过Sanger等人(此后Maxam、Gilbert等人又改进了Sanger的方法)发明的DNA测序技术和EcoRI等限制性内切酶的结合,科学家们很快就开始在生物基因组这片从未被开垦过的处女地上疯狂的耕耘起来。到了上世纪80年代末,人们已经能够测定高达100,000bp的完整病毒基因组。
随着基因组研究的飞速发展,一个以前人们连想都不敢想的计划逐渐在科学家们的脑海中盘旋——他们想要测定人类整个基因组的碱基序列,把人类基因组的30亿个碱基一个一个的检测出来。他们想要破解上帝留给人类的基因“天书”。

人类基因组计划

The nations of the world must see that the human genome belongs to the world's people, as opposed to its nations.

“世界上的国家都必须意识到,人类基因组属于全人类,而非属于某些国家。”

——James D. Watson 分子生物学家,DNA双螺旋结构发现者之一,1962年诺贝尔医学和生理学奖获得者

二十世纪80年代,随着基因测序技术的发展,以及计算机技术的介入,DNA的测序工作变得越来越易于操作,越来越多生物的基因组被辨识,人们不禁畅想:什么时候我们可以把人类基因组的30亿个碱基对的序列统统辨识出来呢?

1984年,美国能源部(United States Department of Energy)首次将旨在对人类基因组测序的人类基因组计划摆上议事日程。虽然此前科学家们已经断断续续测出总计约3700万个碱基对的人类基因序列,但这仅占整个人类基因组的1%多一点。显然,任何个人或团体要想在有生之年达成测序30亿个碱基对的目标,光靠愚公移山的精神是不够的。这不只涉及到大量人力、物力的投入,还要求大量的资金支持。根据当时的技术水平,平均每测量一个碱基对需要的成本约3~5$,而一共有30亿个碱基对需要测定。这样庞大的投资,不是单独的个人或者团体能够负担的,甚至单个的国家都不一定有如此雄厚的财力支持这个计划。因此美国能源部的人类基因组计划一直难以有什么实质性的进展。

直到1988年,美国国家卫生研究院(National Institutes of Health,NIH)来了一个人,这个人的出现使得人类基因组计划真正的开动起来。这个人,就是我们DNA研究者中的战斗机——牛逼小分队的核心人物,DNA双螺旋结构的发现者之一,牛人中的牛魔王,James D. Watson君。

晚年的Watson,真是岁月不饶人

人类基因组计划徽章

Watson君的加入不啻为人类基因组计划的一记强心针。1990年,NIH和美国能源部为他争取到30亿美元的巨额预算用于测序工作,人类基因组计划正式启动。随后,在各国科学家的努力下,英国、法国、德国、日本、中国和印度先后加入了这个庞大的计划。人类基因组计划终于成为一个国际性的科研计划。

当然了,给人类的基因组测序并非如给只有区区100kbp的病毒基因组测序那么简单。人类的基因组共有30亿多个碱基对,通过限制性内切酶可以把它们切成 1mbp(一百万个碱基对)大小的片段,再转到酵母上进行克隆扩增。为了搞清楚放到酵母菌里克隆扩增的到底是哪一段DNA片段,科学家需要一种名为序列位置标签(Sequence Tagged Site, STS)的基因片段来定位。

如果把人类基因组视为一片广阔的土地的话,那人类基因组计划无疑就是为这片土地测绘地图的工作。为了更好的描绘地图,避免在测绘的时候迷路,科学家们需要先在地图上标记一些独特的、整片土地上只有一个的标志物来作为地标,然后在地标之间详细地描绘地图上的细节。而STS,作为一段200~500bp的 DNA片段,每一段STS都只能在人类基因组中找到一次,而且这段STS在哪条染色体的哪个位点的哪个具体位置上,科学家们都已经通过PCR的方法确定了。因此,给一段DNA测序完以后,只要再找到这段DNA上STS的位置,就能推知测出的是哪个位置的DNA序列了。

人类基因组

虽然电子计算机的应用大大减少了科学家们的工作量,但为基因组测序仍然是漫长而枯燥的工作。Watson原本预计花费15年完成人类基因组的测序工作。可惜的是,Watson没能亲手完成这个伟大的任务。人类基因组计划开始没多久,在1992年,Watson即因为反对给人类基因申请专利而被NIH炒了鱿鱼,灰头土脸的离开了这个项目。当时NIH的研究人员通过一项技术辨识出了一段cDNA片段。NIH试图为这段cDNA申请专利,因为为基因申请专利所带来的利润可以刺激相关学科的发展。但Watson却认为所有与人类基因有关的知识都应该免费与全人类共享。由于和领导意见的巨大分歧,Watson不得不卷铺盖走人。当时的人们以为Watson是廉颇老矣,可后来事件的发展却证明姜还是老的辣。那些新生的小牛犊们固然有十八般武艺,也不及老牛的高瞻远瞩,远见卓识。

且说一代大牛渐渐淡出人们的视野,新的时代属于那些年轻的牛犊们,人类基因组测序的伟大事业,将要在这些新兴的大牛们手中完成。

1993年,时年43岁的Francis Collins接替了Watson的工作,开始领导国际基因组计划。此前Collins的成就主要是发现了包括亨廷顿舞蹈病、M4型急性淋巴细胞白血病在内的多种疾病相关的基因,人送外号“基因猎手”(很威风的外号)。不过,Collins固然牛,但大牛们的光环不再,人类基因组计划这艘大船在 Collins这头小牛犊的带领下,战战兢兢的往前行,即将迎来狂烈的风暴,差点面临翻船的危险。

小牛犊Collins

这暴风的源头,源于在人类基因组计划进行到第八年,1998年,一个新时代的大牛横空出世。这位大牛甫一发力,即在学界搅起一阵轩然大波(或者说是一阵妖风),经历诸多坎坷,倒反使得人类基因组计划较预期提前了好几年即告完成。

学界对此大牛议论纷纷,有说他对人类基因组研究做出巨大贡献的,有说他是搅屎棍的,还有人说他是弗兰肯斯坦一般的科学怪人,这个人就是Craig Venter。

Craig Venter——富有争议的科学家

江山如此多娇,引无数英雄竞折腰。
惜秦皇汉武,略输文采;
唐宗宋祖,稍逊风骚。
一代天骄,成吉思汗,只识弯弓射大雕。
俱往矣,数风流人物,还看今朝。
——毛主席《沁园春·雪

俗话说“江山代有才人出,一代更比一代强。”到了二十世纪末,在人类的DNA探索史上留下里程碑的牛逼小分队的老一辈队员们老的老、死的死。而新时代的弄潮儿,牛人中的牛魔王则非Craig Venter君莫属。是的,你没看错,这位Craig Venter正是最近风头正劲,制造出首个的人工合成基因组支配的细胞的那个科学家Venter。

这张肖像正好反映出Venter在世人眼中亦正亦邪的形象

Venter君是个怪才。高中时,他无心学习,却迷恋于水上运动以及泡妞,差点因为成绩太差而退学。后来Venter应征入伍。越战期间,他在越南的美军野战医院服役。这段经历想必给了Venter君相当强烈的刺激。回国以后,Venter君开始发奋图强,拼命考证。在风景如画的加州大学圣地亚哥分校,他获得了生化学学士(1972年)、生理学和药学博士(1975年)一共三个学位。

随后,Venter君到纽约州立大学水牛城分校担任教授。在这个地方,Venter君抛弃了他的前妻,与自己的学生,美貌(?)的Claire M. Fraser结为连理。1984年,Venter来到了NIH(就是老牛Watson领导人类基因组的那个地方)。

Claire M. Fraser

在NIH,发生了两件事情,对Venter君造成了很大的影响。一件事情,是Venter所在的研究院通过一项技术辨识出了一段cDNA片段。NIH试图为这段cDNA申请专利(还记得老牛Watson吗?他就是因为这件事而被NIH炒了鱿鱼。),结果败诉,法院认为这段DNA不具备申请专利的条件。而这项申请案正是Venter负责的。

另一件事情,Venter发现用之前提到的Sanger君发明的“链中止法”给基因一个一个的测序效率实在太差,由此导致整个人类基因组计划的进度严重落后。于是他建议使用速度更快的“鸟枪法”测序。但是此提议遭到NIH的科学家们的一致反对。因为这件事情,Venter君心灰意懒,决定把上司炒了自己单干。

1998年,Venter筹集资金,建立了塞雷拉基因组(Celera Genomics)公司,开展自己的人类基因组计划。

鸟枪法

塞雷拉公司所采用技术,就是俗称“鸟枪法”的“全基因组霰弹枪定序法”(Shotgun sequencing)。这种方法通过把整个人类基因组样本随机断裂成上百万个小碎片,然后用“链中止法”给这些碎片测序。通过计算机辨识碎片中重叠的部分,再把这些碎片拼接起来,形成完整的DNA序列。

这种方法不需要预先检测出测序的小片段的具体位置,只需要将打碎的片段统统测序完,再送到电脑里运算就行了。由于是一口气把整个基因组打碎了来测量,相比传统一条一条染色体测绘的方法,鸟枪法要快很多。然而,由于人类的染色体在某些部位(端粒和着丝点)有着大量重复的序列,用鸟枪法检测这些序列的时候,计算机正是靠不同片段之间重复的部分来判断序列的位置,这些高度重复的序列会导致计算机算出错误的结果,也就是说,鸟枪法处理这些有着重复序列的部分并不十分精确。这也是国际基因组计划的科学家不认可这种方法的原因,他们更倾向于速度慢,但是准确性更高的“链终止法”。

不认可归不认可,Venter用这种方法获得了成功。塞雷拉公司很快就赶上并且超过了国际基因组计划的进度。本来大家以为这也就算科学家的意气之争,但公众绝对料想不到,接下来事情的发展大大超出世人的想象。塞雷拉公司刚开始测序计划的时候,同意将得到的数据和国际基因组计划分享。然而,他们拒绝像国际计划一样,把得到的数据放到网上和全人类共享,也禁止他人自由发布或无偿使用他们得到的基因数据。也就是说,别人想用他们的数据,必须花钱。

到1999年,塞雷拉公司更是作出惊人之举,他们为人类的6500个基因申请专利保护。一旦他们得逞,今后每个地球人体内都将有6500条基因归塞雷拉公司所有,任何人想要检测自己体内的这些基因,或者医药公司想要研发和这些基因有关疾病的新药,抑或科学家想研究这些基因都要给塞雷拉公司交钱。

可以想象,塞雷拉公司和Venter的举动成了众矢之的,人们纷纷指责他们的自私自利会严重妨碍遗传学的发展。这事越搞越大,最后惊动了中央。。。额不。。。美国政府,2000年3月14日,时任美国总统,比尔·克林顿和英国首相布莱尔联合发表声明称人类基因组数据不允许专利保护,且必须对所有研究者公开。如今,任何人都能轻易的在GenBank网站(http://www.ncbi.nlm.nih.gov/sites/entrez?db=nucleotide)上查到人类基因组的信息。

于是Venter和他的塞雷拉公司受到严重的打击。克林顿发表声明的当天,塞雷拉公司的股票就暴跌。他们今后不仅不能通过申请专利赚钱,还不得不把所有的数据都向公众公开。此时,人们不得不佩服老Watson当年的远见卓识,人类基因组计划是为了整个人类谋福利的,任何想将这一成果据为己有的企图都会受到各方面的阻挠。Venter虽牛,却远远没认清这一点。

不过,挫折归挫折,塞雷拉公司仍然保持着基因组测序方面的优势,只要能抢先完成人类基因组测序,Venter他们至少能够获得首个完成人类基因组测序工作的研究者的殊荣。即使赚不到钱,至少也要拿到这个对科学家来说至高无上的荣誉。

Collins的压力很大。他的前任是老一辈牛魔王Watson,他的竞争对手是新一辈牛魔王Venter,而他不过是一头小牛犊而已。他从大名鼎鼎的 Watson那里接过衣钵,带领由各国政府资助、全世界科学家共同参与的基因组计划,现在已经落后于Venter组建的小小的民间机构。更糟糕的是,他的竞争对手声称要把这个成果据为己有,以此向全世界人民收钱。如果让Venter率先完成基因组的测序,这无论如何是难以令人接受的,届时光媒体的口水都能淹死他。

为了能赶上进度,Collins一方面“部分的”引进了鸟枪法,另一方面他开始秘密接触Venter。即使不能抢在他前面,至少要争取到和他共同完成基因组计划的结果。私下的接触自然没有得到什么结果,甚至演变成了激烈的争论,后来又惊动了克林顿。好在总统的面子够大,双方终于妥协,塞雷拉放弃对人类基因的专利要求,而完成人类基因组计划的殊荣将由双方共同获得。

2000年6月26日,伟大的时刻终于来临,美国总统克林顿等六国领导人共同宣布人类基因组计划的草图完成。(附带说明一下,之所以说完成的是“草图”,正是因为鸟枪法无法准确的测序那些高度重复的序列。因此当时公布的草图并不包括这些部分。)

从左至右依次为Venter、Clinton、Collins

当天,Collins和Venter共同出席了新闻发布会。此后,这两个人还共同出现在《时代》杂志的封面上。作为一个民间团体,并且是一个饱受争议的民间团体的领导人,Venter能够获得和政府资助的Collins平起平坐的机会。而且不管人们多么讨厌他,正是由于他的贡献,使Watson原本预计 15年才能完成的计划,整整提前3年即告完成。可以说,Venter已经赢了。他确实是我们现在这个时代当之无愧的牛逼小分队队长。

此外,人类基因组草图的完成,也有中国人的一份贡献。早在1993年,中国就启动了自己的人类基因组测序计划,并且先后在上海、北京成立了南方、北方两个基因组中心,积累了很多基因组测序的经验。1999年9月,中国加入国际基因组计划,负责人类3号染色体上的3000万个碱基对的测序工作,占人类基因组碱基对总数的1%。2000年4月,中国的科学家们顺利的完成了这3000万个碱基对的测序任务,为人类基因组计划贡献了一份力量。

邪恶的《时代》把Venter摆在了Collins前面

2001年2月,Venter和Collins分别发表了各自的基因组研究成果。有趣的是,即使是发文章,这两个人还闹别扭,Venter把文章发到了《Science》,而Collins则发到了《Nature》。

可惜的是,荣誉不能当饭吃,由于不能为人类基因申请专利,不能给公司带来利润,尽管Venter推出了$1,000的私人基因组测序套餐(听起来还是挺诱人的),但是应者寥寥,公司的业绩始终没有起色。终于,塞雷拉公司的股东们忍无可忍,炒了Venter的鱿鱼。

失业的Venter带着在塞雷拉赚到的10亿美金回到了老家以后,把自己的游艇改造成了研究船,跑到百慕大三角去研究海洋生物去了。看起来,这只是个不起眼的研究,但是这个浑身上下散发着非主流气息的科学怪杰难道会甘心做一些无关紧要的研究工作吗?在Venter那神秘的研究船上,这个颇受争议的科学家难道是在酝酿什么骇人的邪恶计划,还是在为人类的未来谋福利呢?

人类基因组计划的故事到此暂告一段落,但是牛逼小分队的故事看来还将继续……其实,如果你还记得前阵子合成生命的传奇,你就知道Venter这些年确实没闲着。

(本文完)

关于研究DNA的传奇人物牛逼小分队系列暂时告一段落。其他几篇按历史时间顺序分别是——

游识猷的《第一个发现DNA的地球人

游识猷的《当DNA还叫转化因子时

以及

seren的《传奇的一小步——合成生命十五年

0
为您推荐

22 Responses to “人类基因组计划:新老大牛的交锋”

  1. lalunasun说道:

    好长啊……
    是不是都得写这么长才算合格啊……

  2. 雪线说道:

    图片下有错字“至次”……

  3. sLow说道:

    很不错啊!!学校刚刚讲到”鸟枪法”,这篇文章刚好看懂。当作是课外补充知识很好!

  4. 圣勺战士说道:

    写的很棒,难懂的东西写通俗了才是牛逼人

  5. 小罗说道:

    感觉是看外传一样,有意思!

  6. 李国志说道:

    风趣横生,基本大事都说了。

  7. 李国志说道:

    呵呵,强,风趣横生,基本大事都说了。

  8. 杨三说道:

    唔,电影和RPG游戏有背景素材了:百慕大的科学家。

  9. guji说道:

    好文,顶!把这么纠结的一段历史讲得很有故事感!

  10. wxmgba说道:

    当年人人网有篇校内体文,一个人打败全球科学家,就是说的Venter

  11. 小CI说道:

    这都几点钟啊

  12. 吴欣童说道:

    楼主今后也是牛一只。

  13. K2说道:

    宣布人类基因组草图完成的元首只有克林顿和布莱尔,法德日派出了大使级别,中国压根没出现。而江扣肉竟然是在这件事的转天才知道有这么回事儿的,而且中国也参与了,打电话问科技部科技部也表示一无所知。后来才打听到是一个叫做华大基因研究院的民营科研机构自掏腰包完成的,遂掏腰包解决了困扰华大基因多年的债务。

  14. K2说道:

    另,真Venter无双!铁杆粉丝绝对挺!表示和collins和venter都见过面……

  15. pioneer说道:

    诙谐幽默,详细生动,难得一见的好文

  16. lalunasun说道:

    我表示我想写《DNA护肤:化妆品中隐藏的秘密》……
    随口说说……

  17. [...] 不论科学家是否愿意,如今的科学研究,早已不再是那种苹果树下思考问题的自娱自乐。发达的传播媒介可以在短时间将那些原本只在学术圈内慢慢流传的研究内容变成地球人都知道的科学故事。对于科学研究而言,这种关注可说是“有利有弊”。公众的关注可以让科学研究得到更大的重视,获取更多的资源。2010年因人造生命话题而大出风头的生物学家Craig Venter就是利用公众关注的高手 (他的故事,可见http://songshuhui.net/archives/45095)。另一方面,如霍金所言,公众因为不理解科学而产生不信任,使关注变成争议。 [...]

桌面版 | 切换到移动版