第二章 走入基因-1

英国历史学家王比德的着作,是英格兰在8世纪勒唯一真实的貂料采源,曾经对人类短暂的生命提出一个强而有克的比喻。他说:“生命就象是备便里坐在餐桌前,仰和郡长5乡钢共享大簧。突然留到一受小麻雀经显地飞过大厅,从一个门飞过来,然后又很快地从另一个门飞出去。在它短暂停留在屋内的这段的阎,丝毫没有受到寒风怒吼的影响,但是这段平静时光像门车一样,一瞬即逝,于芝麻雀在冬天的寒风中飞来又飞回去,消失在你围限激。人类的生党也像是这样,先是什么,之后又会青什么,我们都一无所知。”

圣地级的比喻着重在宗教意义,但是生物学上刻词另一翻解读。基因安它自己的记忆,解读基因可以为我们带来希望,能够蕾穿这个短餐、受到国限的生肖厅堂,霍到厅外的记乔,知通在人类生向出现2到的点滴,基因能测未采的情沉。

SieveJOnes1953年4月25日,900个字改变了世界,这些字是由詹姆士·沃森(J。WatSOn)和法朗西斯·克里克(FranisCrick)所撰写的简短报告书,它被刊登在名为《遗传》

(Nature)的着名科学杂志上。他们开始这么写着:“我们想提供有关DNA(脱氧核糖核酸)结构。此结构有通俗的特色,具有许多生物趣味。”他们也谨慎地下了以下的结语:“我们注意到,我们主张的特定配对,有可能是基因要素的模仿机制。”

多年之后,1991年,沃森在《重组体DNA》第二版书内写着“没有任何物质像DNA般重要……如果我们希望在未来,同时生命的全部奥秘也能够纳入生物学家的掌控之中,那么加达探讨DNA的秘密,是有其必要性的。”

这是沃森还是个25岁的剑桥大学准博士班学生时所写的文章,《遗传》被视为有所保留的经典名作。后来成为诺贝尔佐冠诗人和世界着名科学家的瓦特林,在40年后的言论,也未超出此范畴。

何以DNH一个纯粹分子——的结构与作用,会认为与全部生命的奥和有密切关联?

所有全部的细节,都留给了未来的生物学者。不过,沃森和克里克也分析过,令人惊异的单纯和美妙对称的分子,显示有可贵的秘密存在于生命极中心一基因里。

什么是基因

基因是DNA分子上含特定遗传信息的核育酸序列的总称,是遗传物质的最小功能单位。

基因一词是英语“gsne”的音译,是“开始”、“生育”的意思。它源于印欧语系,后变为拉丁语的gM(氏族)以及现代英语中genus(种属)、genius(天才)、genial(生殖)等诸多词汇。1909年,丹麦学者约翰逊提出基因这一名词,用它来指任何一种生物中控制任何遗传性状而其遗传规律又符合于孟德尔定律的遗传因子。

在孟德尔定律发现之前,人们对生物遗传曾提出了诸多的说法。如普遍流行的融合遗传论就认为双亲的遗传物质在子代中像血液一样混合,被稀释且不能分开,但孟德尔的实验结果则相反,现代隐性基因并不在杂交子一代中消失,它所决定的性状还能在于二代中出现。据此孟德尔提出了“遗传颗粒”学说。20世纪初叶孟德尔理论在许多动植物中得到了进一步的验证。最有代表性的是1910年美国科学家摩尔根发现果蝇的白眼性状的伴性遗传现象,即白眼性状始终在雄性果蝇中出现,第一次把一个特定的基因定位于一条特定的染色体(决定性别的性染色体)上,使遗传学和细胞学终于殊途同归。有人曾对此作了一个形象的比喻:若将孟德尔学说比作是从生物雄壮的交响乐中分解出七个音符,那么摩尔根的染色体遗传理论则不仅证实了六弦琴上六根琴弦的存在,而且证明了这七个音符就是从这只大弦琴上发出来的。

孟德尔学说和摩尔根的基因论都把基因看作是一个界限分明的独立遗传单位,甚至到本世纪50年代初人们在对基因的化学本质(核酸)及DNA双螺旋结构有了明确认识后,仍然认为基因是不可分的基本遗传单位,如同当初人们认为分子是物质的基本粒子一样。

这种观念直到1957年才得到纠正。

着名遗传学家本泽尔在经过10年艰苦工作,取得了三大发现后提出了全新的基因概念,于是彻底冲破了经典基因不可分的观念。他认为:(1)作为基因的单位,可以精确到单核育酸或碱基水平,称为突变子。(2)作为交换单位,同突变单位一样,仍以单核计酸为基本单位,称为互换子。(3)作为功能单位,基因也是可分的。本泽尔的功劳不仅在于提出了全新的基因概念,而且把“基因”作为一种概念引入到遗传学实验中来了。本泽尔把突变子成互换子像绘制染色体图一样排列在基因图谱上,这是遗传学上一次从宏观到微观的飞跃。

1969年,夏皮罗等人从大肠杆菌中分离到乳糖操纵子并使它在离体条件下转录。证实了一个基因可离开染色体而独立发挥作用。1970年,梯明发现了仅以RNA作为遗传物质的逆转录病毒,提示遗传物质不仅仅是DNA,也可以是RNA,从而使中心法则内容得到扩展。

时隔20年后的1977年,人们又在猿猴病毒(SV。)和腺病毒(AdV)中发现某些基因中存在内部间隔区,间隔区的顺序与基因所决定的蛋白质序列没有任何关系——这使科学家们大吃一惊。随后,基因的这种可分割、不连续的现象在酵母tRNA基因、果蝇的n3NA基因、人的胶原蛋白基因中也得到了证实。这样基因的概念中又多了一项新内容:

基因结构具有不连续性。因为这是生物界尤其是真核生物中普遍存在的现象,为便于称呼,人们把这种分裂基因中能实现遗传信息表达的部分称为外显子,而不表达部分称作内含子。

1980年法国科学家斯洛宁姆斯基在酵母线粒体DNA的研究中证实,一个基因的内含子可能是另一个基因的外显子,也就是说,内含子也可能是具有功能的,剪接酶并没有把它们带到死亡中去,生物界中DNA的所有成员可能没有废料。

与基因分裂或不连续性的概念相反的是基因的重叠性。1977年桑格等在噬菌体甲174DNA中和1978年菲尔斯等在SV40DNA中均发现了几个基因共用同一段DNA序列的情况。

虽然这种现象在自然界并不普遍,但至少说明基因确实存在着阅读框架的重叠现象,这体现了生物的“节约”原则。

对经典的、近代的以至现代的基因概念的挑战还不止这些。比如,一个基因一个多肽假说,在相当长的时间被证明是正确的,可是近年来发现一些基因绝不产生任何蛋白质或者多肽,而仅产生RNA,各种tRNA、rRNA基因就是这样。因此人们只有加以补充:

基因的功能在于决定蛋白质或核酸。但是这仍不能解释一些事实:DNA中确实存在一些片段,它根本不产生任何物质而仅以位置或结构起作用。例如,操纵区和启动区,它仅起识别蛋白质(酶)的作用,由引来开放或关闭它“下属”的活动。而另一些基因,如假基因,眼下甚至还看不出有什么作用。这样就很难从产物上给基因下一个统一的定义。

本世纪对年代末,在大肠杆菌中发现了一种奇特的现象,基因可以在染色体及染色体外的DNA之间往返“飞行”。其实这种基因的跳跃现象在50年代初就被一位女科学家麦克琳托克在研究玉米组织分化现象时发现,只不过她的发现当时并未引起人们的普遍关注而已。随后不久基因跳跃现象又在人的免疫球蛋白基因中得到了证实,这样人们才充分意识到基因的稳定性是相对的。医学家们还进一步设想或许基因的这种不稳定性可能与癌症和传染性疾病也有很大关系。麦克琳托克作为首次发现基因不稳定性的人,于1983年获得了诺贝尔生理学及医学奖。(赖立辉)

染色体是基因的载体

19世纪后半叶,在细胞学说的启迪下,人们认识到研究细胞的结构和生理,是阐明生命现象(包括生殖和遗传在内)的捷径,此外,随着物理学和化学的发展,当时已有较好的显微镜、切片机和各种化学染料为细胞学的研究提供了十分有利的条件。于是,生物学家相继发现和描述了细胞的有丝分裂和生殖细胞在成熟过程中的减数分裂等。这些发现把人们的注意力集中到染色体上来。早在1882年,德国细胞学家弗鲁门(W·Flermming,1843—1915)在研究细胞分裂时,发现核中有容易染色的部分,并把它称之为染色质。其后,1888年,德国解剖学家沃德耶(W.Waldewr,1836一1921)正式把弗鲁门发现的染色质称之为染色体。从此之后,有关染色体的研究报告层出不穷。人们发现同一物种所有个体的染色体对数是相同的、稳定的,并且在许多生物体同一个核内不同染色体对的大小、形态也有明显的区别,从而提出了染色体的个性和连续性的假设。

特别是染色体在细胞分裂过程中的行为更引人注目。它使人们联想到遗传基因的变化和高等动植物在有性生殖过程中染色体的行为是平行的或一致的。比如说,基因的体细胞中是成对的,染色体在体细胞中也是成对的;基因在生殖细胞中是成单的,染色体在生殖细胞中也是成单的;不同对的基因可以在分离过程中自由组合,同源染色体的减数分裂过程中也恰好是随机分配的。就是说,基因的分离和分配,对应于减数分裂期间生殖细胞内染色体的分配和四分体的形成。按此理解,杂种后代(F;)在形成配子时,同源染色体分离,产生了数目相等的两类配子,一类只含基因A,另一类只含基因a,假定所有配子受精的税率相等。这些配子的接将随机结合,那么会产生4种组合;即AA、ZAa和aa。当A代表显性,a代表隐性时,这就表现为孟德尔的分离定律。这样,孟德尔所发现的遗传定律,就可以从生殖细胞形成期间染色体的行为来理解。正如美国细胞学家萨顿(W.Sutton,1877-1916)在他的《遗传和染色体》(1903年)一文中所概括的:

父本和母本的染色体联合成对及它们在减数分裂中的分离构成孟德尔定律的基础。就是说,在雌雄配子形成和受精过程中,染色体的行为与孟德尔遗传因子(即基因)的行为是平行的,只要假定基因是在染色体上,分离定律和自由组合定律的表现就会得到解释。

萨顿的概括在当时并没被多数人认同。持不同意见的人认为,基因和染色体的那种相互关系最多不过是彼此同时发生而已,把孟德尔的基因同染色体相提并论显得有点似是而非。美国的生物学家摩尔根呼·H·haap,1866-1945)就持有这种看法。因此他试图用实验来解决这个问题。1910年,他选用果蝇作材料进行性别决定的遗传学实验。

一天,他偶然发现在培养瓶里有一只雄果蝇的身上出现了一个细小而明显的变异,即它与通常的红眼果蝇不同,而是具有白眼性状。接着,摩尔根把那只雄果蝇同它的红眼姊妹一起饲养,看看会有什么变化,结果他发现所有的杂种一代都是红眼的。如果将FI近交(指亲缘关系极近的个体之间杂交),那么所产生的马,有红眼的,也有白眼的,它们之间的数量比例是3:1。这个实例表现得如词典型的孟德尔式的基因一样。有趣的是,曼的白眼果蝇全部都是雄性个体。以后的多次交配表明,白眼几乎总是出现在雄性果蝇身上,但偶尔也会出现一只白眼的爆果蝇。这使摩尔根想到,决定红眼和白眼这两种性状的基因很可能总是与决定性别的染色体成分联系在一起的,即可以设想这个白眼基因位于X染色体上,而y染色体上没有它的等位基因。摩尔根把这种伴随着决定性别的染色体而遗传的现象,叫做伴性遗传。伴性遗传的发现,首次把一个特定的基因(如决定果蝇眼睛颜色的基因)和一个特定的染色体以染色体)联系起来,从而用实验证明染色体是基因我本此后,摩尔根还进一步研究了在同一条染色体上的基因的传递规律。他选用黑体残翅(用bV表示)的雄果蝇和灰体长翅(用BV表示)的雌果蝇杂交,得到的Fl全是灰体长翅的。然后他用Fl的雄果蝇和隐性亲本付一回交,按照分离定律和自由组合定律,本应预期得到4种类型的后代,即BV、By、bV和协。但是,实验的结果只有两种类型,即灰体长翅和黑体残翅。摩尔根是这样解释他的实验结果的。他说:如果假定B和V这两个基因在同一条染色体上,b和V这两个基因在相对的另一条染色体上,上述的遗传现象就可以解释得通了。就是说,不同染色体上的基因虽然可以自由组合,但在同一条染色体上的基因(比如B和V,b和V),它们总是在一起,就不能自由组合了。摩尔根把这样的遗传现象,叫基因的连锁。

连锁基因是不是完全不能交换呢?实验证明也不是这样,像雄果蝇那样的完全连锁是罕见的。在大多数的情况下,每个基因连锁群并不是永远紧紧地连锁在一起的,相对基因之间有可能出现某些交换。比如说,在上面的试验中,如果不是用FI的雄果蝇而是用FI的雌果蝇与隐性亲本回交,那么就可以得到4种类型的后代,不过交换类型的数目要比预期的少得多。它们的比例是:BV.(0.42),By(0.08),bV(0,08),bvN.42)。其中交换类伽和bV之间只占16%。因此摩尔根把他的发现叫基因的连锁和互换定律。

基因的连锁和互换是生物界普遍存在的现象。并且实验证明,两对性状不管杂交时怎样组合,对于同一连锁群的两个特定基因之间的交换率,总是一个常数或不变的定值。

例如,实验测得果蝇的黄体基因和白眼基因的交换率是1.2%,白眼基因和翅脉二裂基因之间的交换率是3.5%,黄体基因和翅脉二裂基因之间的交换率是4.7%。由此可知,黄体基因和白眼基因的交换率加上白眼基因和翅脉二裂基因的交换率,恰恰等于黄体基因和翅脉二裂基因的交换率。也就是说,在同一连锁群内的三个基因之间的交换率,只要知道两个数值,就可以推知第三个数值一定是前者的和或差。如果拿一定的交换值作为长度单位,同时假设两条染色体在它们的任何基因位点之间都可能产生交换,交换值和基因之间的距离成正比例。那么我们画出来的基因分布图将是一条工整的直线。由此可以推知,基因在染色体上是按一定的次序和距离作直线排列的。

摩尔根和他的同事们把杂交研究同细胞学结合起来,以令人信服的实验证明基因存在于细胞染色体上并作有规律的传递,从而建立了染色体遗传理论(或细胞遗传学)。

他在1926年发表的《基因论》一书中,对20世纪头30年遗传学发展的巨大成果作了如下的概括:基因论认为个体上的各种性状都起源于生殖质里的成对要素(基因),这些基因相互联合,组成一定数目的连锁群;认为生殖细胞成熟的时候,每一对的两个基因依孟德尔第一定律(分离定律)而被此分离,于是每个生殖细胞只含一组基因;认为不同连锁群里的基因依孟德尔第二定律(自由组合定律)而自由组合;认为两个相对连锁群的基因之间有时候也发生有秩序的交换;并且认为交换率证明了每个连锁群里诺要素的直线排列,也证明了诸要素的相对位置。

DNA是基因的化学实体

细胞遗传学确定了染色体是基因的载体,但是,对于基因的化学本性还是几无所知的。比如,基因究竟是什么化学物质,它在遗传传递中到底如何发生作用?这些问题在摩尔根时代还不能作出确切的回答。但是,摩尔根毕竟触及到了这个问题。他在《基因论》的末尾总结部分,讨论到基因属不属于有机分子一级时,他根据计算基因的大小来估计,认为基因不能当成一个化学分子;基因甚至可能不是一个分子,而是一群非化学性结合的有机物质。然而他并不排除这样的假设:“基因之所以稳定,是因为它代表着一个有机的化学实体。”

在寻找基因的化学实体上,细胞化学起着重要的作用。细胞化学的研究表明,染色体作为细胞结构的一个基本组件,它主要是由蛋白质和核酸这两类化学物质组成的。那么遗传物质究竟是蛋白质还是核酸?按照传统的观念,蛋白质作为生命物质的主要成分和一切生命现象的体现者,它不仅普遍存在于生物界参与所有的生命过程,而且它的化学结构也有多样性和可塑性,似乎很适于作遗传物质。然而科学实验部否定了这种看法,确认核酸是遗传物质,蛋白质不过是它的产物。

认识到核酸是遗传物质(或基因的化学实体)有一段漫长的历史过程。早在1928年,英国的细菌学家格里菲斯(F.Griffith,1881-1941),用肺炎球菌做实验时发现了一个令人惊异的现象。当他把大量已经杀死的能致病的S型肺炎球菌(外形有荚膜,在培养基上形成的菌落是光滑的),与少量活着的不能致病的R型肺炎球菌(外形无荚膜,在培养基上形成的菌落是粗糙的)混合在一起,注射到试验动物体内的时候,令人惊异地发现这些试验动物都得病死了,并从它们的体内分离出许多S型的肺炎球菌。人们把这种由R型的肺炎球菌转化为S型肺炎球菌的现象,称之为转化现象。为什么会发生这种转化现象呢?当时人们推想一定是S型肺炎球菌的某些物质被R型肺炎球菌吸收了,使它转变为S型肺炎球菌。但是,这是什么样的化学物质?当时还不清楚。

1944年,美国的生物化学家艾弗里等做了一个体外实验查明,原来是S型肺炎球菌里的脱氧核糖核酸(简称DNA)这种化学物质在转化现象中起作用。他们先把S型肺炎球菌磨碎用水抽提,发现这种抽提液中有蛋白质、DNA、脂肪和糖类等化合物。然后将抽提液放过培养基(一种人工配制的适合细菌营养要求的混合物)中,并用它来培养R型肺炎球菌,结果发现在培养基里产生S型肺炎球菌。这与格里菲斯所看到的转化现象一样,因此可以考虑在这种抽提液中确实存在着某种促成性状转化的因子。但这种因子是蛋白质,还是DNA,或是其他物质。为了弄个明白,艾弗里等人对这些物质逐一做了研究。当他们从S型肺炎球菌中抽取出提纯的DNA,放到R型肺炎球菌的培养基上时,结果在那里发现了S型肺炎球菌,而用蛋白质或其他物质的抽提液代替DNA时,并没有发生这种现象。当他们在DNA的抽提液里加些蛋白酶时,并不影响实验结果,但若加进DNA酶时,转化现象便消失了。由此可见,不是别的物质,正是DNA在转化舞台上担任着独特的角色——遗传物质的角色。1952年,赫尔希和蔡斯继文弗里等人之后,又做了一个权威性的实验。他们用32P和”S分别标记惯菌体(寄生在细富体内的病毒)的DNA和蛋白质的部分,然后用标记过的农菌体去感染细富,发现当细菌被感染对,噬菌体的DNA进人寄生细胞,而其蛋白质外壳却留在外边,并且进人寄生细胞的DNA能够复制出同原来一样的噬菌体。这个实验进一步确证DNAffiff传物质或基因的化学实体。

既然DNA是遗传物质,那么它本身有什么条件可以充当这个角色呢?这就要讲到DNA的化学组成及其结构了。DNA是核酸的一种。核酸最早是1869年由瑞士的青年化学家米歇尔(F.MieSChr,1844—1895)发现的。他为了想搞清楚细胞核的化学性质,用盐酸处理脓细胞;以稀碱分离出核,经沉淀后分析其中的成分,发现氮和磷的含量特别高。

由于这类物质是从细胞核中分离出来的,又都表现为酸性,故人们把它叫做核酸。后来,经过许多科学家的研究,终于搞清楚核酸是由核音酸作为基本单位组成的聚合物。接着酸本身也是比较复杂的化合物,它是由戊糖、碱基和磷酸三个部分组成的。根据组成核酸的核音酸中戊糖种类的不同,可将核酸分成两大类,即核糖核酸(简称RNA)和脱氧核糖核酸(简称DNA)。前者的戊糖部分是核糖。后者是脱氧核糖。除了糖组分不同外,这两类核酸中所含的碱基种类也不完全相同。RNA含腺源哈(用A表示),鸟瞟吟(用G表示)、胞呼峻(用C表示)和尿晓晚(用U表示)。DNA则含A、G、C、T(胸腺呼陡)而没有U。实际上,DNA和RNA的碱基只有一个不同,即在RNA中T为U所代替。核着酸按255所含碱基不同,分别叫腺着酸(AMP)或脱氧腺着酸(dAMP)、鸟着酸(GMP)或脱氧鸟昔酸(dGMP)、胞音酸(CMP)或脱氧胞着酸(dCMP)、尿着酸(U’MP)和脱氧胸腺着酸(dTMP)等。这些核音酸是通过脱水绩合作用而成为聚合物的。在核酸分子中,核音酸的排列是有一定顺序的,这种核高酸的线性序列就是核酸的一级结构。虽然组成DNA或RNA的核音酸只有4种,但是由于它们排列顺序的不同,便可构成核酸分子的多样性。假定一个核酸分子是由100个4种不同核音酸组成的。那么它就可能提供4‘ho这么多种不同的排列顺序。

在没有搞清楚DNA的三维结构(或空间结构)之前,要想从其化学本性来说明它的遗传职能,是很困难的。这个问题亟需解决。1953年,沃森(J.D.Wason,1928-)和克里克(F.HCCri吹,1916)应用物理学、化学的新技术和生物学研究的新成果,运用综合的观点,把自己的创造性工作同前人的研究成就结合起来,提出了DNA分子双螺旋结构模型,成功地解决了DNA的三维结构问题。他们认为,DNA是由两条多聚脱氧核音酸链围绕一个中轴旋转而形成像麻花那样的螺旋结构。在这个结构中,磷酸和脱氧核糖组成的主链在外侧,碱基在内侧,两链间的碱基通过氢键相互连接,并且有一定的规律,即A配T,C配G,每对碱基处于同一平面,不同碱基对互相平行,而和中心轴垂直。图3—5是DNA分子双螺旋结构模式图。(A)是以骨架形式展示出来的DNA模型。(B)是DNA的填充空间模型。

很明显,这样一个分子模型包含有相当大的生物学意义。它首次为生物的生殖和遗传提供了化学基础。正如沃森和克里克所说的,“DNA双螺旋模型的碱基特异性配对的原则,立即展示出遗传物质可能有的复制机制。”还提出,“倘若得知配对键的一侧碱基的实际顺序,人们就可以写下另一侧的碱基的精确顺序。因此可以说,一条链是另一条的互补链,正是这一特征提示着DNA分子为什么会自我复制。

沃森和克里克的预言,不久(195年)便为梅塞尔松(M.Meseson,1930-)等人的工作所证实。1963年,美国科学家凯恩斯(c劝ms)还用电子显微镜和放射自显影技术相结合的方法,成功地拍摄到大肠杆菌DNA复制过程的图象,从而直接证明沃森和克里克对于DNA复制推测的正确性。

基因概念的现代理解

验明DNA是基因的化学实体并确定它的双螺旋结构和复制机制是划时代的事件,它使经典遗传学的基因概念发生了深刻的变化。按照经典遗传学的理解,基因是抽象的、不可分的遗传单位。而DNA被确定为基因的化学实体之后,基因却是个实实在在的化学分子,基因的概念被定义为DNA的一个有遗传功能的片段,这个片段带有通常为蛋白质和RNA编码的一个遗传信息单位。或者说,基因就是一个具有特定的连续的核音酸线性序列。以噬菌体M%为例,它是由3569个核音酸组成的单链RNA分子(在一些生物中RNA也可作为遗传物质),共有三个基因,分别负责A蛋白、外壳蛋白和RNA复制酶的合成,称之为A蛋白基因外壳蛋白基因和RNA复制酶基因。现在已经搞清楚,在M%RNA分子的开头有由129个核资酸组成的先导序列,接着依次是A蛋白基因(含1179个核音酸)、外壳蛋白基因(含390个核音酸)和RNA复制酶基因(含1635个核着酸)在A蛋白基因和外壳蛋白基因之间有一个间隔区(含26个核音酸)。在外壳蛋白基因和RNA复制酶基因之间也有一个间隔区(含36个接着酸)。最后是由174个核音酸组成的终未序列。先导序列、终未序列和两个间隔区的核音酸是不表达的,即不能转体为蛋白质。

按照上述的现代基因概念,不仅完全可以解释经典遗传学所能解释的一切。而且还能解释经典遗传学所难以解释的一些现象。例如,经典遗传学解释不同性状差异的原因,只能答之以“不同的基因”,而现在却能用DNA或RNA链核着酸顺序如何改变导致产生不同的蛋白质来说明;还有突变不只可解释为基因的变化,而且还可以用DNA链的重排和它的效应来说明;再有经典遗传学不能回答基因为何能一次又一次地复制,而现在却可以用DNA的自体复制功能来说明。此外,从现代遗传学的观点来看,不能互换进一步分割的,或负责突变的DNA的也可能只包括一个核音酸对,所以在功能单位内可以进行互换或发生突变的,有时可能只涉及到功能单位的一个小区段,如血红蛋白的点突变。因此,基因作为功能单位、突变单位和重组单位并不是三位一体的。也就是说,基因作为功能单位,它指的是一个具有特定的连续的核音酸序列,而突变可以是其中的一个或者几个核音酸对,并不一定是整个基因。至于交换,在一个基因组(指生殖细胞中的染色体数目)中的任何两对核音酸之间,都是有可能发生遗传物质的交换或者重组的。因此,基因不是不可分的而是可分的。

除此之外,实验还证明基因是可以移动的,这种移动不限于传统的等位基因之间的交换,而还可以在同一条染色体不同区段和不同染色体之间的非同源区段移动。早在40年代,美国遗传学家麦克林托克在研究玉米籽粒颜色的高频变异时,就已注意到了基因可以移动的现象。她在研究过程中发现,玉米籽粒的颜色很不稳定,有时籽粒上会出现一些斑斑点点。为什么会有这种现象?她提出了一个全新的概念来解释,认为遗传基因是可以移动的。她把这种可移动的基因叫做控制因子或转座子(现在多称跳跃基因)。

这些跳跃基因能在玉米不同的染色体上从一个位点转移到另一个位点,有时像一个新奇的生物学开关一样,开动或关闭基因。比如说,当玉米染色体上产生紫色的基因gy附近插入一个跳跃基因DS时,它即以一定的速率关闭ffi,使其籽粒不能产生紫色而成黄色。

当DS从Xi附近跳开后,Xi的抑制便解除,随即恢复紫色。DS也可爱另一个跳跃基因AC的作用。当AC离DS不远时,它可阻止DS的作用,同样可以解除DS对to的抑制。如果DS跳到离AC很远的地方时,或者AC本身跳开后,则DS即不受AC的作用,DS又对to起抑制作用。

这些跳跃基因跳动得如此之快,以致使得受它们控制的颜色基因时开时关,于是玉米粒粒上便出现斑斑点点。由此可见,跳跃基因与传统的基因概念不同,它本身虽不表达某种性状,但却可以引起颇为广泛的遗传效应。尽管麦克林托克的这一发现是很了不起的。

但却没有引起当时人们的关注。

大约过了20年,美国的梅勒米(Malaxnv)、德国的焦敦(Johdan)和英国的夏皮罗(Shapiro)等人分别用分子生物学方法,在微生物遗传学的研究中,也发现了类似当年麦克林托克所提到的转座子时,跳跃基因的概念才为人们所普遍接受。跳跃基因的概念,使人们认识到功能上相关的各个基因,并不一定以紧密连锁的形式存在,它们可以分散在不同染色体或者同一染色体的不同部位上,因此极大地丰富和发展了现代基因概念。

此外,近半个世纪的遗传学研究表明,除了核基因外,还有校外基因,即存在细胞质里面的基因。例如,细胞质中的某些细胞器,像质体、线粒体和叶绿体等就含有各自的DNA。这些DNA的作用与细胞核内的染色体基因很相似,于是人们把它们叫做核外基因。

受核外基因控制的遗传,它的表现与核遗传不同。人们通常把它叫做细胞质遗传。细胞质遗传与核遗传的差异,首先表现在它总是表现为母系遗传。所谓母系遗传指的是用具有相对性状的亲本杂交,不论正交或反交,其FI总是表现母本性状的遗传方式。这是因为卵细胞含有大量的细胞质,而精子所含的细胞质却很少。特别是精子在受精过程中,进入卵细胞的主要是细胞核。因此,受精卵的细胞质就主要来自卵细胞了。所以细胞质遗传总是表现为母系遗传。其次,细胞质遗传杂种后代的遗传行为不符合经典遗传学的三个基本规律,即既无一定的分离比例,也不存在自由组合和连锁与互换的关系。这是由于在细胞分裂过程中,细胞质不像核染色体那样进行有规律的分离和组合。细胞质里的基因复制后的细胞分裂时,不是平均地而是随机地分配到子细胞中去的。细胞质遗传现象的发现,扩大了核遗传的概念。实验证明,有许多生物的某些性状(如草履虫的放毒与否)是由核内基因与核外基因共同决定的,如草展虫释放毒素的核外基因,也要有相应的核内基因的存在才具有复制、增殖和传递的功能。

关于基因怎样发生作用的问题,遗传学家曾为此而感到困惑不解,但生物化学的进展却使人们顿开茅塞,认识到基因的作用可能与酶有关。因为在生物体内所有的生物化学过程都必须有酶的参与,在酶的催化下进行的,如果缺少某种酶一定的生物化学反应就不能进行,如没有淀粉酶,淀粉在生物体内就不易分解等。由此遗传学家猜想到基因对性状发育的控制,也很可能是通过酶的作用来实现的。40年代,美国遗传学家比德尔(G·W·Beach,1913-)和塔特姆(E·L·TatUm,1909-1975)以红色面色霉这种微生物为材料,进行一系列的生化遗传学实验,查明在红色面色霉的生物合成中,每一阶段均受到某一基因的支配,当这个基因因突变而不活动时,则中断了这种酶反应。例如当控制合成精氨酸的基因发生突变对,这一品系的红色面包零就不能合成精氨酸,说明在生物合成过程中酸的反应是受基因支配的。根据这个事实,比德尔和塔特姆在1946年提出了“一个基因一个酶”的理论,把基因与酶的关系作为基因怎样发生作用中的一个关键性论点鲜明地提出来了,但它却没有去探索基因的化学本性和基因究竟怎样导向酶的形成这样一些重大的问题。不过50年代分子生物学诞生之后,对这些问题的研究就有了答案或新的进展。

遗传密码

当20世纪40年代,人们认识到DNA是遗传物质,而蛋白质是基因的产物时,就开始研究这两种生物大分子之间的联系。1953年夏天,基于如下两点认识提出了遗传密码的设想。

第一,在DNA多核音酸链上核音酸碱基的确切的序列代表了基因的遗传信息第二,任何基因的信息内容除了代表给定的多肽的一级结构(即氨基酸排列顺序)之外,不可能有任何其他的东西。

这样,就把多核音酸链上的核音酸碱基序列与多肽链上的氨基酸序列联系起来了。

通常把核酸分子(RNA)上单核音酸序列与多肽链上氨基酸序列联系起来的讯号,称之为遗传密码。就像打电报中阿拉伯数字的排列决定文字的“电码”一样,不同时减基排列顺序,就起到了遗传密码的作用。60年代,分子遗传学的研究表明,核酸分子中每三个碱基编成一个密码子(三联体),决定一个氨基酸。例如,GGU,GGC,GGA和GGG都是甘氨酸的密码子。1966年,克里克根据当时已经取得的成果,排出了一个遗传密码表。

这个表有如下的特点:第一,几乎所有的氨基酸都有一个以上的密码子,只有甲硫氨酸和色氨酸仅由一个密码子表示;第二,密码有明显的结构,同一氨基酸的同义码几乎都在同一方格中(有6个同义码的例外),因此一个密码子与另一个密码子的区别仅在其第三个核音酸中的最后一个;第三,密码表中有三个无字义的密码子,即UAG、UAA和UGA,它们全都不代表任何氨基酸。

70年代末,比利时肯定大学的菲耳斯(W.Fiers)以噬菌体M&为材料,对遗传密码表作了精确的验证。他分析了M&外壳蛋白的129个氨基酸的顺序,又分析了决定外壳蛋白的基因的390个核音酸的顺序,发现它们两者之间的关系完全符合密码表上的规定。

现在已查明,遗传密码在整个生物界都是适用的。因此,遗传密码的阐明继细胞学说之后,又一次具体地证实了有机界的统一性,在分子水平上进一步揭示了有机体产生。

生长和构造过程的秘密,并在生物体内的化学变化中增加了信息量的变化的新概念,使生物学的内容更为丰富多彩。

中心法则

前面已经提到DNA分子有自我复制的功能,通过复制能把原有的遗传信息原封不动地保留下来,保证了遗传信息的世代相传。但是,核酸分子和其他化学分子一样并不是一成不变的,在体内外各种因素的影响下,它们经常都在变化中。因此,在核酸分子复制自体的过程中,如果发生碱基的缺失、增加、取代或重组等情况,那么核酸分子的这种变化就会反映到遗传密码或生物性状的变异中来。例如,在控制血红蛋白会成的密码中,如果GAA或GAG中的碱基发生变化,A变成了U或者U取代了人那么GAG和GAA就变成了GUU或GUG,这样由它们所控制合成的氨基酸也就由原来的谷氨酸变成了领氨酸,从而影响到整个血红蛋白分子的正常生理功能,发生镰形红血球贫血症。由此可见,通过核酸分子中所携带的遗传密码的变化,就使生物体具有无限变异的潜能。

DNA作为基因的化学实体,仅仅有复制和变异还是不够的。它还应当能够指导蛋白质的合成,使蕴藏在自身的遗传信息转变为生物体的各种性状。这是一个非常关键或核心的问题。分子遗传学的研究表明,DNA作为蛋白质的合成的模板并不是直接参与蛋白质的合成,而是通过一个中介物——RNA来起作用的。也就是说,NDA分子所携带的遗传信息,首先要通过转录,把它记录在RNA分子上,然后再通过RNA这个直接模板去指导蛋白质的合成。所谓转录,是在RNA聚合酶的催化下,以DNA为模板会成RNA的过程。转录时,DNA双螺旋解开,然后以其中的一条链为模板。这条链能为RNA和蛋白质编码,因此叫做编码链。在RNA聚合酶的作用下,编码链根据碱基互补配对的原理,进行RNA链的合成。所合成的RNA分子很快脱落下来,这时DNA双螺旋中解开的区域又重新螺旋化,恢复原来的状态。转录是在核酸内部发生的信息转移过程,其结果是在DNA分子的不同部位合成出三种RNA,即mRNA。ilZNIA和四m入它们被合成后即从细胞核转移到细胞质中,各起着不同的生物学作用。rnRNA(信使RNA)含有合成蛋白质所需要的信息,是细胞蛋白质合成的直接模板。dZ:NA(核糖体RNA)和细胞中原有的一些蛋白质结合形成核糖体,核糖体的作用好像“装配机”,是细胞蛋白质合成的“车间”。d(NIA运载RNA)形似三叶草,在它的一端(上面为ACC一端)可与特定的氨基酸结合,另一端则带有和InRNA所携带的碱基互补的碱基,即如果d协议上的碱基顺序是CCC,那么ot:NA上的碱基顺序则为GGC。tR:NA的作用就是把细胞中游离的氨基酸运送到核糖体上,在那里按照rnRNA的秩序排列连接起来,最终完成蛋白质的合成。

接下来是核酸分子中的遗传信息如何转变为生物体的各种性状(即吁相格林哈样的蛋白质)。换言之,核酸分子中的核管酸顺序为蛋白质分子中的氨基酸顺序。在这里,遗传密码起着关键的作用。人们把这个遗传信息从核酸流向蛋白质的过程,即以1llttrvrt为模板合成蛋白质的过程,叫做翻译或转泽。转择与转录不同,它是发生在核酸和蛋白质两类不同分子间的化学过程,传译的结果不是产生核酸分子而是合成蛋白质分子。转录和转择的区别可用如下图式表示:

通过转录和转择这两个生物学过程,细胞内的蛋白质合成就完成了。1958年,克里克把遗传信息由DNAnmRNA一蛋白质的传递过程,叫做中心法则。中心法则说明遗传信息在两类不同的生物大分子之间的转移都是单向的、不可逆的,只能从DNA到RNA,从RNA到蛋白质。这两种信息的转移在所有生物的细胞中都得到了证实。70年代以来,在深入研究RNA病毒致癌机理过程中,美国的科学家特明(H·Tedn,1934一)和巴尔蒂姆(D.Baltimore,1938-)分别在RNA肿瘤病毒中发现和证实有一种反向转录酶的存在。在这种酶的参与下,这种病毒可以用RNA为模板,反向地合成DNA,然后再以这段病毒DNA为模板,互补地合成RNA。这是RNA病毒复制的另一种形式。根据这个事实,人{1把中心法则作了修改为下图的形式。

这里遗传信息的转移可以分为两类。一类用实线箭头表示,包括DNA的复制、RNA的转录和蛋白质的转译。另一类用虚线箭头表示,包括RNA的复制、RNA反向转录为DNA和从DNA直接转译为蛋白质。前一类的信息转移普遍存在于所有生物细胞中,后一类的信息转移只在RNA病毒中存在。至于遗传信息从DNA到蛋白质的转移,只是一种理论上的可能性在活细胞中迄今尚未发现。

中心法则的实质是遗传信息,一旦转移到蛋白质分子之后,就不能再从蛋白质分子中转移出来。这是因为核酸和蛋白质的分子结构完全不同,在核酸分子之间的信息转移可以通过碱基互补配对来实现。但从核酸到蛋白质的信息转移则需要通过极为复杂的转译机构来完成,而这个机构迄今所知是不能反向转译的。中心法则合理地说明了在细胞的生命活动中,蛋白质和核酸这两类生物大分子的联系和分工。核酸的功能是储存和转移遗传信息,指导和控制蛋白质的合成,而蛋白质的主要功能则是进行新陈代谢活动和作为细胞结构的组成成分。所以拉马克的获得性遗传是没有科学根据的。

从全面看,固定DNA控制着蛋白质的合成,决定着蛋白质的遗传性质,但是核酸分子自身的复制、转录等生物学功能的发挥,也是离不开蛋白质(特别是酶)的控制的,离开了蛋白质或有关酶的参与,核酸分子的复制、转录等生理过程也不能进行。因此,在生物体中,蛋白质和核酸就是这样形成了一种既相互联系又相互制约的自动控制体系,不断地进行自我复制、自我更新,使生命的存在、延续和发展成为可能。