C.高度重复序列:约为300bp的重复顺序,一个基因组中有几百份甚至几百万份拷贝,复
性时间以秒计。既有重复几百分拷贝的基因,如rRNA基因和某些tRNA基因,更多的则是很短的非编码序列。呈头尾衔接的串联重复序列(tandem repeat)
按照基因组的分子量计算,哺乳动物的基因组中极大部分是重复序列。在非重复序列中,编码肽链的基因估计不超过百分之几。重复顺序是真核生物DNA区别于原核生物的一个重要特征。
(三)重复序列家族
重复序列家族(sequence family)是指一类核苷酸序列高度相似的重复序列,包括基因和基因以外的序列。
真核生物基因组中来源相同、结构相似、功能相关的一组基因可归为一个基因家族(gene family)。但重复序列主要是基因以外的DNA序列,根据其在基因组中的组织形式,可分为串联重复序列和散在重复序列。多数来源于反转录转座子。
1.卫星DNA(satellite DNA)
DNA片段在氯化铯密度梯度离心中,按其大小在离心管内,形成不同的条带,根据荧光强度分析,可以看到在一条主带以外还有一个或多个小的卫星带,称卫星DNA,这种DNA的GC含量较少,密度低。
卫星DNA按其浮力密度的大小可以分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四类(1.687, 1.693, 1.700g/cm),
3
都是由各种不同的重复序列家族组成,通常是串联重复序列.
卫星DNA按其重复单元的多少可分为两类:
(1)小卫星DNA(minisatellite DNA),由几百个核苷酸对的单元重复组成。(又:由11-60个bp的串联重复序列组成)。
(2)微卫星DNA(microsatellite DNA),由2-20bp重复成百上千次组成。(又:1-5bp)
DNA指纹(DNA fingerprints):利用微卫星DNA的某些位置上的这种串联,成簇的重复单位数目不同,在串联重复序列两侧用限制性内切酶酶切后,就会产生重复单位数目不等的片段,具有丰富的多态性。这种多态性亦称VNTR序列(Variable number of tandem repeat可变串联重复序列)。以 VNTRs中的特异序列为探针进行 Southern杂交,杂交带谱具有高度的特异性。
倒位重复序列:这是两个序列的互补拷贝在同条DNA链上的反向排列,如
GCACTTC??GAAGTGC CGTGAAG??CTTCACG 2.散在重复序列
以散在方式分布于基因组内,一般都是中度重复序列。分为
(1)短分散重复序列(short inter spersed nuclear elements)SINEs长度在500bp以下。人类基因组中,重复拷贝数达10万以上。
人类基因组中所有SINE之间的平均距离约为2.2Kb。如Alu序列家族,人类基因组中约有50万-70万拷贝,平均每隔4 Kb就有一个Alu。一个典型的Alu序列长282bp,有一个限制性内切酶AluⅠ的识别序列ACCT。
(2)长散在重复序列(long interspersed nuclear elements, LINEs)重复序列单元长度1000bp。
第三节 基因内部的精细结构
过去一直认为基因是一个功能单位,同时也是一个突变单位,交换单位,即所谓三位一体的概念,认为:交换只能发生在基因之间,而不能在它们之中;突变只能从一个基因变成另一个基因,其内部没有改变变化的更小单位。
20世纪40年代,在果蝇研究中发现,根据表型标准被认为是两个等位基因的突变型却可以发生重组而得到野生型,这种紧密连锁的功能性等位基因,但不是结构性的等位基因称为拟等位基因。
精密的微生物遗传分析证明,基因并不是最小的不可分割的单位。
一、顺反子、突变子与重组子
1.重组测验
1955年,美国的S.Benzer(本泽)用大肠杆菌T4噬菌体作为材料,研究快速溶菌突变型rⅡ的基因精细结构,发现在一个基因内部的许多位点可以发生突变,并可以在这些位点之间发生交换,从而说明一个基因是一个功能单位,但并不是一个突变单位和交换单位,因此,一个基因可以包括许多突变单位和许多重组单位。 2.互补测验
Benzer分析了rⅡ区域大约2000个(有些不能重组)突变型,知道这些突变分布在308个(能重组)位点上。那么,这308个位点是属于一个基因还是几个基因?为了划分这种功能单位界线,必须进行互补测验。
Benzer用不同的rⅡ突变型成对组合去感染大肠杆菌K(λ)菌株。他发现:rⅡ突变型可分成rⅡA和rⅡB两个互补群。所有rⅡA突变型的突变位点都在rⅡ区的一头,是一个独立的功能单位;所有rⅡB突变型的突变位点都在rⅡ区的另一头,凡是属于rⅡA互补群的突变不能互补,同理属于B互补群的突变也不能互补,只有rⅡA的突变和rⅡB的突变可以互补。 3.顺反子、突变子与重组子的概念
(1)顺反子(cistron):Benzer把在反式构型中不能互补的各个突变型在染色体上所占的一个区域称为一个顺反子。
顺反测验结果表明,顺反子是一个必须保存完整才具胡正常生理功能的遗传物质最小单位。实际上它是基因的同义词。是一个功能水平上的基因。rⅡ区内,有两个基因,但可在许多位点发生突变和重组。
(2)突变子(muton):是指一个顺反子内部能发生突变的最小单位。一个突变子可以小到只有一对碱基。
(3)重组子(recon)是基因内不能由重组分开的遗传单位,即基因内出现重组的最小区间。重组子的单位可以小到核苷酸对。
总结:每个顺反子在染色体(DNA)上的区域称为基因座(locas),而每个基因座上有许多突变位点(site),它是一个顺反子内部能发生突变的最小结构单位,称为突变子;一个突变可以小到一对碱基,我们知道,DNA中每一核苷酸对的改变都可引起肽链中氨基酸的改变,从
而影响顺反子的功能,但它本身没有独立的功能,它们之间可以重组,而重组的最小结构单位称为重组子,重组子可以小到邻近碱基对间的重组。由此可见,顺反子既具有功能上的完整性,又具有结构上的可分割性。
二、断裂基因
传统的观点认为每个结构基因是一段连续的DNA顺序,到1977年法国的Chambom等和美国的Berget等首次在猴类病毒SV40和腺病毒中发现基因内部以及基因与基因之间存在有间隔顺序(spacer sequence),从而导致隔裂基因的概念。
1、断裂基因:基因的编码顺序由若干非编码区域(间隔序列)隔开,使阅读框不连续,这种基因称为隔裂基因(split gene,interrupted gene隔裂基因)。
通读框(open reading frame),在一条DNA链上,从起始密码开始到终止密码为止的连续核苷酸密码序列。
一个基因由几个互不相邻的段落组成,它们被长达数百乃至数千个核苷酸对的间隔序列所隔开。
在真核类中,几乎所有基因内部都含有不转译的部分。在转录为初级RNA时(或后),这一序列被切除。
图4-8 卵清蛋白基因及其与cDNA的杂交图
目前,已从珠蛋白、卵清蛋白、免疫球蛋白基因、tRNA、rRNA基因中,均发现具有这种间隔顺序的断裂基因。
2、外显子(exon或extron):基因的转译部分。DNA序列中将被转录为mRNA、tRNA、rRNA的那些序列。
3、内含子(intron):不转译的部分。在成熟的mRNA、tRNA、rRNA上未反应出来的DNA区段,即被切除的间隔序列。
Gilbert提出基因是被表达的外显子镶嵌在沉默的内含子中的一种嵌合体。而内含子的核苷酸数量可比外显子多5-10倍。
4、RNA剪接
5、断裂基因的意义
(1)有利于储存较多的信息:不同的剪接方式对应不同的mRNA,从而对应不同的多肽。 (2)有利于变异和进化 (3)增加重组机会
(4)可能是基因调控装置:内含子本身、转录水平和转录后水平
第四节 基因空间位置关系
一、重叠基因
传统的观点认为每个基因是由一些密码子组成。而这些密码子是有序地排列在DNA链上,基因在染色体上是一个接一个地排列(线状排列)并不重叠。
1977年F.Sanger(桑格)分析了噬菌体φX174 DNA全序后,发现它只有5375个核苷酸,共组成了九个基因,而这九种基因共编码了2000种氨基酸,按三联体密码子的原则应有6000个核苷酸,而实际数与理论数却相差625个核苷酸。Sanger实验室的Barrell等在其核苷酸全序测定以后,发现φX174基因组中有些读码是重读的,即一种蛋白质的编码顺序内可以存在着另一种蛋白质的遗传信息。这就是重叠基因(overlapping genes)。
图4-9。φX174DNA中D基因和E基因的开始和结尾。说明:核苷酸顺序号从D基因的起始密码算起,E基因从179号开始。其阅读相(reading phase)跟D基因岔开。E基因包含在D内(60%)。D基因与J基因首尾重叠。D的终止点A,即J的开始处。
进一步研究发现基因有各种重叠方式: 1、大基因之内包含小基因 如
,由于密码读框不同而得到不同的蛋白质。
2、前后基因产首尾重叠