◆           大统一:分子遗传学的诞生                 ·方舟子·   在DNA被确认为遗传物质之后,生物学家们不得不面临着一个难题:DN A显然不可能是传统认为的四核苷酸聚合体结构,那么DNA应该有什么样的结 构,才能担当遗传的重任?它必须能够能够携带遗传信息,能够自我复制传递遗 传信息,能够让遗传信息得到表达以控制细胞活动,并且能够突变并保留突变, 这四点,缺一不可。如何建构一个DNA分子模型解释这一切?   当时主要有三个实验室差不多同时在研究DNA分子模型。第一个实验室是 伦敦国王学院的威尔金斯(Maurice Wikins)、弗兰克林(Rosalind Franklin) 实验室。他们用X射线衍射法研究DNA的晶体结构。当X射线照射到生物大分 子的晶体时,晶格中的原子或分子会使射线发生偏转,根据得到的衍射图象,可 以推测分子大致的结构和形状。第二个实验室是加州理工学院的大化学家鲍林 (Linus Pauling)实验室。在此之前,鲍林已发现了蛋白质的α-螺旋结构。 第三个则是个非正式的研究小组,事实上他们可说是不务正业。23岁的年轻的 遗传学家沃森(James D. Watson)于1951年从美国到剑桥大学做博士后时, 虽然其真实意图是要研究DNA分子结构,挂着的课题项目却是研究烟草花叶病 毒。比他年长12岁的克里克(Francis Crick)当时正在做博士论文,论文题 目是“多肽和蛋白质:X射线研究”。沃森说服与他分享同一个办公室的克里克 一起研究DNA分子模型,他需要克里克在X射线晶体衍射学方面的知识。他们 从1951年10月开始拼凑模型,几经尝试,终于在1953年3月获得了正 确的模型。关于这三个实验室如何明争暗斗,互相竞争,由于沃森一本风靡全球 的自传《双螺旋》而广为人知。就象一切的自传,在史实方面未必完全可靠,这 也已有多部著作做了更为客观的描述,在这里不必细述这个发现过程的种种细节。 值得探讨的一个问题是:为什么沃森和克里克既不象威尔金斯和弗兰克林那样拥 有第一手的实验资料,又不象鲍林那样有建构分子模型的丰富经验(他们两个人 都是第一次建构分子模型),却能在这场竞赛中获胜?   这些人中,除了沃森,都不是遗传学家,而是物理学家或化学家。威尔金斯 虽然在1950年最早研究DNA的晶体结构,当时却对DNA究竟在细胞中干 什么一无所知,在1951年才觉得DNA可能参与了核蛋白所控制的遗传。弗 兰可林也不了解DNA在生物细胞中的重要性。鲍林研究DNA分子,则纯属偶 然,他在1951年11月《美国化学学会杂志》上看到一篇核酸结构的论文, 觉得荒唐可笑,为了反驳这篇论文,才着手建立DNA分子模型。他是把DNA 分子当作化合物,而不是遗传物质来研究的。这两个研究小组完全根据晶体衍射 图建构模型,鲍林甚至根据的是30年代拍摄的模糊不清的衍射照片。不理解D NA的生物学功能,单纯根据晶体衍射图,有太多的可能性供选择,是很难得出 正确的模型的。   沃森在1951年到剑桥的之前,曾经加入噬菌体小组,做过用同位素标记 追踪噬菌体DNA的实验,坚信DNA就是遗传物质。据他的回忆,他到剑桥后 发现克里克也是“知道DNA比蛋白质更为重要的人”。但是按克里克本人的说 法,他当时对DNA所知不多,并不觉得它在遗传上比蛋白质更重要,只是认为 DNA做为与核蛋白结合的物质,值得研究。对一名研究生来说,确定一种未知 分子的结构,就是一个值得一试的课题。在确信了DNA是遗传物质之后,还必 须理解遗传物质需要什么样的性质才能发挥基因的功能。象克里克和威尔金斯, 沃森后来也强调薛定谔《生命是什么?》一书对他的重要影响,他甚至说他在芝 加哥大学读本科时读了这本书之后,就立志要破解基因的奥秘。如果这是真的, 我们就很难明白,为什么沃森向印第安那大学申请研究生时,申请的是鸟类学。 由于印第安那大学动物系没有鸟类学专业,在系主任的建议下,沃森才改而从事 遗传学研究。当时大遗传学家缪勒恰好正在印第安那大学任教授,沃森不仅上过 缪勒关于“突变和基因”的课(得了A分),而且考虑过要当他的研究生。但觉 得缪勒研究的果蝇在遗传学上已过了辉煌时期,才改拜研究噬菌体遗传的卢瑞亚 (S.E.Luria)为师。但是,缪勒关于遗传物质必须具有自催化、异催化和突变 三重性的观念,想必对沃森有深刻的影响。正是因为沃森和克里克坚信DNA是 遗传物质,并且理解遗传物质应该有什么样的特性,才能根据如此少的数据,做 出如此重大的发现。   他们根据的数据,仅有三条:第一条是当时已广为人知的,即DNA由六种 小分子组成:脱氧核糖,磷酸和四种碱基(A,G,T,C),由这些小分子组 成了四种核苷酸,这四种核苷酸组成了DNA。第二条证据是最新的,弗兰克林 得到的衍射照片表明,DNA是由两条长链组成的双螺旋,宽度为20埃。第三 条证据是最为关键的。美国生物化学家查加夫(Erwin Chargaff)是听说了艾弗 里的转化实验结果后就认定DNA是遗传物质的少数人之一,也是最热衷的一个, 他甚至因此就放弃其他工作专心测定DNA的分子组成,发现DNA中的四种碱 基的含量并不是传统认为的等量的,即“四核苷酸聚合体”结构是错误的。虽然 在不同物种中四种碱基的含量不同,但是A和T的含量总是相等,G和C的含量 也相等。   查加夫早在1950年就已发布了这个重要结果,但奇怪的是,研究DNA 分子结构的这三个实验室都将它忽略了。甚至在查加夫1951年春天亲访剑桥, 与沃森和克里克见面后,沃森和克里克对他的结果也不加重视。在沃森和克里克 终于意识到查加夫比值的重用性,并请剑桥的青年数学家约翰·格里菲斯(细菌 转化现象的发现者的外甥)计算出A吸引T,G吸引C,A+T的宽度与G+C 的宽度相等之后,很快就拼凑出了DNA分子的正确模型。   沃森和克里克在1953年4月25日《自然》杂志上以一千多词和一幅插 图的短文公布了他们的发现。根据他们的模型,DNA是由两条由脱氧核糖和磷 酸交替组成的长链形成的双螺旋,每一个脱氧核糖上都连着一个碱基。这两条长 链通过碱基之间的氢键而结合在一起,碱基以A对T,G对C的原则互补配对。 按照碱基配对的原则,一条链上的碱基顺序确定之后,另一条链上会有什么碱基 也就自动被确定了。在论文中,沃森和克里克以谦逊的笔调,暗示了这个结构模 型在遗传上重要性:   “我们并非没有注意到,我们所推测的特殊配对立即暗示了遗传物质的复制 机理。” 在随后发表的论文中,沃森和克里克详细地说明了DNA双螺旋模型对遗传 学研究的重大意义:一、它能够说明遗传物质的自我复制。在复制时,DNA的 双链拆开,成为两个模板,再根据碱基配对的原则,复制成两个与原来的DNA 序列一模一样的新分子。这两个新DNA分子中,分别有一条链是旧链,一条链 是新合成的链。这个“半保留复制”的设想后来被麦赛尔逊(M.S.Meselson)和 斯塔勒(F.W.Stahl)用同位素追踪实验证实。二、它能够说明遗传物质是如何 携带遗传信息的。DNA上碱基序列就是遗传信息,由四种碱基的排列组合可以 携带无限多样的遗传信息。三、它能够说明基因是如何突变的。基因突变是由于 碱基序列发生了变化,这样的变化可以通过复制而得到保留。   但是遗传物质的第四个特征,即遗传信息得到表达以控制细胞活动呢?这个 模型无法解释,沃森和克里克当时也公开承认他们不知道DNA如何能“对细胞 有高度特殊的作用”。不过,在这时候,基因的主要功能是控制蛋白质的合成, 这种观点已成为一个共识。比德尔等人对面包霉代谢的研究还只是间接地证明这 一点,而鲍林等人在1949年对镰刀型贫血症这种遗传疾病的研究,则提供了 进一步的证据。在20世纪上半叶,遗传学家已发现镰刀形贫血症与一个隐性基 因(s)有关。正常人的基因型是SS,基因型为ss的人则患贫血,其红细胞 呈镰刀形,而杂合体Ss在一般情况下表现正常,在缺氧时红细胞也会变成镰刀 形。鲍林等人将三种人的血红蛋白放在电场中分离(电泳),发现它们的走向不 同,正常人(SS)的血红蛋白移向正极,ss人的血红蛋白移向负极,而Ss 的血红蛋白则分成了两部份,一部份移向正极,一部份移向负极,这就证明了S 和s等位基因分别产生了不同的血红蛋白。在1950年代末,因格兰姆 (V.M.Ingram)将血红蛋白用蛋白水解霉分解成26个片段再跑电泳,发现在正 常人和镰刀形贫血症患者只有1个片段不同,该片段由8个氨基酸组成,将二者 的序列测定、做了比较后,发现只有1个氨基酸不同:正常血红蛋白中的一个谷 氨酸,在镰刀形红细胞血红蛋白中被缬氨酸所取代。显然,由S到s的基因突变 导致了血红蛋白的氨基酸序列发生变化,又由此引起了镰刀形贫血症。   那么基因又是如何控制蛋白质的合成呢?有没有可能以DNA为模板,直接 在DNA上面将氨基酸连接成蛋白质?在沃森和克里克提出DNA双螺旋模型后 的一段时间内,即有人如此假设,认为DNA结构中,在不同的碱基对之间形成 形状不同的“窟窿”,不同的氨基酸插在这些窟窿中,就能连成特定序列的蛋白 质。但是这个假说,面临着一大难题:染色体DNA存在于细胞核中,而绝大多 数蛋白质都在细胞质中,细胞核和细胞质由大分子无法通过的核膜隔离开,如果 由DNA直接合成蛋白质,蛋白质无法跑到细胞质。另一类核酸RNA倒是主要 存在于细胞质中。RNA和DNA的成份很相似,只有两点不同,它有核糖而没 有脱氧核糖,有尿嘧啶(U)而没有胸腺嘧啶(T)。早在1952年,在提出 DNA双螺旋模型之前,沃森就已设想遗传信息的传递途径是由DNA传到RN A,再由RNA传到蛋白质。在1953-1954年间,沃森进一步思考了这 个问题。他认为在基因表达时,DNA从细胞核转移到了细胞质,其脱氧核糖转 变成核糖,变成了双链RNA,然后再以碱基对之间的窟窿为模板合成蛋白质。 这个过于离奇的设想在提交发表之前被克里克否决了。克里克指出,DNA和R NA本身都不可能直接充当连接氨基酸的模板。遗传信息仅仅体现在DNA的碱 基序列上,还需要一种连接物将碱基序列和氨基酸连接起来。这个“连接物假说”, 很快就被实验证实了。DNA能指导合成三种RNA:DNA上的碱基编码以互 补配对的形式合成信使RNA,后者携带这个如何合成蛋白质的遗传信息转移到 细胞质中,在核糖体与核糖体RNA结合。转运RNA的一头是碱基,进入核糖 体与信使RNA上的碱基配对,另一头携带氨基酸,后者互相连接就形成了蛋白 质。转运RNA就是克里克所猜想的连接物。   在1956年,克里克提出了两个学说,奠定了分子遗传学的理论基础。第 一个学说是“序列假说”,它认为一段核酸的特殊性完全由它的碱基序列所决定, 碱基序列编码一个特定蛋白质的氨基酸序列,蛋白质的氨基酸序列决定了蛋白质 的三维结构。第二个学说是“中心法则”,遗传信息只能从核酸传递给核酸,或 核酸传递给蛋白质,而不能从蛋白质传递给蛋白质,或从蛋白质传回核酸。沃森 后来把中心法则更明确地表示为遗传信息只能从DNA传到RNA,再由RNA 传到蛋白质,以致在1970年发现了病毒中存在由RNA合成DNA的反转录 现象后,人们都说中心法则需要修正,要加一条遗传信息也能从RNA传到DN A。事实上,根据克里克原来的说法,中心法则并无修正的必要。   碱基序列是如何编码氨基酸的呢?克里克在这个破译遗传密码的问题上也做 出了重大的贡献。组成蛋白质的氨基酸有20种,而碱基只有4种,显然,不可 能由1个碱基编码1个氨基酸。如果由2个碱基编码1个氨基酸,只有16种 (4的2次方)组合,也还不够。因此,至少由3个碱基编码1个氨基酸,共有 64种组合,才能满足需要。在1961年,克里克等人在噬菌体T4中用遗传 学方法证明了蛋白质中1个氨基酸的顺序是由3个碱基编码的(称为1个密码 子)。同一年,两位美国分子遗传学家尼伦伯格(W.M.Nirenberg)和马特哈伊 (J.H.Matthaei)破解了第一个密码子。他们人工合成了一条完全由尿嘧啶(U) 组成的RNA,连同20种氨基酸加入从细胞中分离出来的核糖体中,结果发现 形成了一条完全由苯丙氨酸组成的多肽链,证明了UUU是苯丙氨酸的密码子。 对其他密码子的鉴定并不都这么简单。一直到1966年,全部64个密码子( 包括3个合成终止信号)才被鉴定出来。做为所有生物来自同一个祖先的证据之 一,密码子在所有生物中都是基本相同的。人类从此有了一张破解遗传奥秘的密 码表。   分子生物学一词最早为洛克菲勒基金会自然科学分部主任维佛(W.Weaver) 在一份报告中使用,意指一个用现代技术研究亚细胞物质的结构与功能的新领域。 在洛克菲勒基金会的资助下,德布吕克(M.Delbruck)在1940年代创建噬菌 体小组,一向被认为是分子生物学诞生的标志。这批受波尔、薛定谔、缪勒的影 响而研究生物遗传的物理学家的最初目的,乃是要在生命现象中发现新的物理定 律,而并不是真正在研究生物的遗传问题。他们把蛋白质当作遗传物质,迟迟不 承认DNA的重要性,搞错了研究对象。他们完全忽视了化学方法的重要性── 德布吕克以“贬低生物化学”著称,而生物化学其实才是在分子水平上研究遗传 现象的主要方法。因此,分子遗传学的传统是从比德尔、艾弗里等人的生物化学 研究开始的,而在1953年随着沃森-克里克模型的诞生而确立。沃森虽然是 噬菌体小组的成员,然而他却从来不是物理学家,而是受过博物学教育的遗传学 家。克里克虽然是学物理出身,却来自与噬菌体小组(信息学派)完全不同的另 一个生物物理传统──欧洲的结构学派,这个学派坚信生命现象不存在特别的物 理定律,普通的物理定律可以解释一切的生命现象,致力于探讨生命大分子的结 构。而按照沃森、克里克本人的说法,他们在建构模型时,则受的是化学家鲍林 的影响。建构DNA双螺旋模型时所依据的两条主要数据,一条来自生物物理( X射线衍射图),一条来自生物化学(查加夫比值),而成功的关键,又是因为 充份了解基因的遗传学特性。DNA双螺旋结构的提出,不只是在化学家影响之 下,一名遗传学家和一名物理学家的成功合作,更象征着生物学、化学和物理的 统一。缪勒当年的号召已经实现。分子遗传学就是一门综合了遗传学、生物化学、 生物物理和信息学,主宰了生物学所有学科的研究的的新生学科。   DNA双螺旋模型(包括中心法则)的发现,是20世纪最为重大的科学发 现之一,也是生物学历史上唯一可与达尔文进化论相比的最重大的发现,它与自 然选择一起,同为统一了生物学的大概念。分子遗传学的诞生同时也宣告了传统 意义上的遗传学(经典遗传学或传递遗传学)做为一门前沿学科的终结。经典遗 传学的每一条定律或例外,都可以在分子水平上加以解释,从这个意义上说,经 典遗传学已被分子遗传学所取代。在经过了近百年的探讨之后,基因的本质已经 明了。但是人类对遗传现象的研究远远没有结束。有关基因的调控、功能和历史, 它在发育、生理和进化的作用,还存在许多重大的问题有待解决和发现。在经历 了一百年的风雨沧桑之后,遗传学仍然是一门年轻的科学。 2001.5.31. (附记)这个介绍遗传学历史的系列,将做为《基因时代的反思--基因的历史、 哲理与伦理》的一个章节正式出版。在写作时,除原始资料外,还参考了以下著 作。 Henig, Robin Marantz. The Monk in the Garden: The Lost and Found Genius of Gregor Mendel. 2000. Houghton Mifflin Co. Mayr, Ernst. The Growth of Biological Thought: Diversity, Evolution, and Inheritance. 1985. Belknap Press. Moore, John A.. Science as a Way of Knowing: the Foundations of Modern Biology. 1993. Harvard University Press. Olby, Robert. The Path to the Double Helix: the Discovery of DNA. 1994. Dover Publications, New York. Wallace, Bruce. The Search for the Gene. 1992. Cornell University Press.               阿 甘 谈 “芯”                ·阿 甘·