◇◇新语丝(www.xys.org)(xys7.dxiong.com)(xys.ebookdiy.com)(xys2.dropin.org)◇◇   基因序列是怎么巧妙测出来的   ·方舟子·   11月19日,英国著名生物化学家弗雷德里克·桑格在睡梦中去世,享年95岁。 在学生物出身的人当中,桑格是一个尽人皆知的传奇式人物,传奇到很多人听到 他的死讯时,都很惊讶他还活着。他一个人解决了现代生物学的两大实际难题: 怎么测定蛋白质的序列和怎么测定DNA(脱氧核糖核酸)的序列。因此他两次获 得诺贝尔奖,在历史上,只有四个科学家有此殊荣(其中一个——美国化学家鲍 林——第二次获得的还是没有含金量的和平奖),而桑格是最后一个。1955年, 桑格测定了第一种蛋白质(牛胰岛素)的序列和结构,3年后因此获得诺贝尔化 学奖。1977年,桑格发明了一种快速测定DNA序列的巧妙方法,3年后再次获得诺 贝尔化学奖。桑格发明的DNA测序方法很快成为各个分子生物学实验室的常规方 法,成为最常用的测序方法达20多年之久(人类基因组序列就是用这种方法测定 的),一直到现在,在小规模的DNA测序中还在使用。   现在的生物系研究生已经不需要自己去测DNA序列了,只需把DNA样品交给负 责测序的技术人员,自动测序仪很快就会报出结果。我这一代的研究生,则要自 己动手测序,掌握手工测序技术是基本功,跑出一个漂亮的“测序胶”,是一项 技术活。测序也是分子生物学实验中最有意思的部分,所以现在的学生不再自己 测序,真是失去了不少乐趣。实验第二天,取出测序胶辐射感光的底片,对着灯 光依次读出底片上一条条黑带,一一记录下来:A、T、G、C……就仿佛又亲手破 译了一小段生命的奥秘。   生命的奥秘,或者说遗传的信息,就隐藏在DNA的序列中。DNA是一种很长很 大的分子,它是由四种脱氧核苷酸链接而成的,这四种脱氧核苷酸分别简称A、T、 G、C。这四种脱氧核苷酸的排列组合,就构成了DNA序列,所谓测序,就是要知 道某一段DNA上的核苷酸是怎么排列的。在正常状态下,DNA是由两条链组成的, 这两条链的序列存在着互补:如果一条链上某个位置上是A,另一条链上的同一 位置就是T,如果是G,对应的就是C。所以只要测定了一条链的序列,根据A对应 T,G对应C的互补原则,就可以知道另一条链的序列。在细胞准备分裂、需要复 制遗传信息时,DNA的两条链解开变成两条单链,然后分别以这两条单链为模板, 根据互补的原则,合成出另一条链。这个复制过程,需要三样的东西,一样是四 种脱氧核苷酸作为原料,一样是能把脱氧核苷酸链接起来的DNA聚合酶,但这种 酶不能从头开始复制,需要前面已经有了一小段和模板结合的DNA作为复制的起 点(叫做引物),然后才能往上加新的脱氧核苷酸,所以最后一样需要的东西是 引物(在细胞中,引物是由不需要引物的另一种酶合成的)。   桑格就是巧妙地利用了DNA复制机理来测定序列的。桑格的巧妙之处在于, 除了上述三样东西,他给增添了一样东西:四种双脱氧核苷酸,它们在脱氧核苷 酸A、T、G、C的基础上又少了一个氧原子(分别标记为ddA、ddT、ddG、ddC), 它们能够根据互补的原则加到DNA链上,但是由于少了一个氧原子,没法再加核 苷酸了,所以复制就到此为止。   好了,现在可以开始测序了。把要测序的DNA样品分成四份,每一份都加上A、 T、G、C、DNA聚合酶和引物(实验用的引物是用化学方法合成的一小段DNA作为 复制的起点,要合成它需要知道它有什么样的序列。你可能会奇怪,还没测序呢, 怎么知道引物的序列?这是因为要测序的DNA是用分子克隆技术插进载体DNA中的, 载体DNA的序列是已知的,可以根据载体DNA序列设计引物,最后测序的结果实际 上是前面有一段载体DNA序列,后面才是我们要的DNA序列)。再给每一份样品分 别加上一种双脱氧核苷酸,例如第一份加ddA,第二份加ddT,第三份加ddG,第 四份加ddC。然后在一定条件下让它们开始复制DNA。我们假定DNA模板的第一个 核苷酸是T,复制时与它互补的应该是A,在第一份样品中有ddA,如果跟T互补的 是ddA,那么这条链的复制就终止,得到的是最小的一个片段;如果结合上去的 是A,复制就继续下去,直到又碰到一个T,再次出现是ddA还是A的选择……依次 类推,在第一份样品中,复制的结果得到的是一条条以ddA为终端的不同长度的 DNA链,第二份以ddT为终端,第三份以ddG为终端,第四份以ddC为终端。把四份 样品中的新DNA链综合起来看,就是一条条长短不一的DNA片段,每个不同片段的 长度只差一个核苷酸,那么,如果能把这些DNA片段从短到长依次排列,看它们 最后一个核苷酸是什么样的,依次记下来,不就是我们想要的DNA序列了吗?   这时候就需要跑“测序胶”了。把四份样品并排分别加到凝胶中,通上电。 DNA分子带负电,在电场的作用下,在凝胶中DNA片段向正极方向跑,短的DNA片 段跑得快,长的DNA片段跑得慢,这样,不同长度的DNA片段就可以在凝胶中一一 分开,处于不同的位置上。然后把凝胶烘干,覆盖上底片。为了能看出DNA片段 所在的位置,实验用的核苷酸是用放射性同位素做了标记的,它们能够发出射线 让底片感光。第二天,取出底片冲洗,可以看到上面有一条条小小的黑带表示不 同DNA片段所在的位置。从跑得最快的那条黑带开始找起,如果它是来自第一份 样品的,写下A。再找第二快的黑带,如果是来自第三份样品的,写下G。再找第 三快的黑带,看它是来自哪份样品的……这样找下去,一一记下来,比如: AGTTACC……这就是我们想知道的DNA序列。   在桑格同时和之后,还有别人发明别的DNA测序方法,有的已取代桑格方法 用于大规模测序。但是没有哪一种测序方法像桑格方法那样让人有耳目一新、恍 然大悟的惊艳之感。1991年我初到美国留学时,全校外国研究生集中培训,为带 本科生的课做准备。培训快结束时,要求每个人上台科普一项本学科知识。我当 时正忙于测序(还因为测序的工作,在一篇发表在英国《自然》的论文上挂名), 就上台讲了桑格测序法。其他系的研究生居然也听得津津有味,有人还感叹道: “能想到这个方法的人,真是个天才!”然而,在他留下的唯一篇自传(写于 1988年)中,桑格却说:“和我多数的科学同行不同,我在学术方面并不聪颖。 我从未获得过奖学金,如果我的父母不是相当富裕的话,我很可能上不了剑桥大 学;不过,在那些实验非常重要以及相当狭窄的专门知识很有用处的研究领域, 我努力让自己与学术上最优秀的人并驾齐驱。”1983年,桑格65岁时他决定退休, 回家当园丁,因为他觉得发明DNA测序法是他所能达到的顶峰,再继续从事科研 已没有意义。 2013.11.27 (《新华每日电讯》2013.11.29) (XYS20131130) ◇◇新语丝(www.xys.org)(xys7.dxiong.com)(xys.ebookdiy.com)(xys2.dropin.org)◇◇