分子标记与遗传图谱(7)

2020-03-27 02:29

第二节 图谱构建的理论基础

一、染色体遗传理论

1903年W. S. Sutton和T. Boveri分别提出了遗传因子位于染色体上的理论,他们将染色体看作是孟德尔基因的物理载体。该理论亦称为Sutton-Boveri染色体遗传理论,其基本要点如下:(1)体细胞核内的染色体成对存在,其中一条来自雌亲,一条来自雄亲,成对染色体的两个成员是同源的。(2)每条染色体在个体的生命周期中均能保持其结构上的恒定性和遗传上的连续性,因而在个体的发育过程中起着一定的作用。(3)在减数分裂中,同源染色体的两个成员相互配对,随后又发生分离,走向细胞的两极,从而形成两个单倍体性细胞。

二、基因重组和连锁理论

连锁图谱构建的理论基础是染色体的交换与重组。在细胞减数分裂时,非同源染色体上的基因相互独立、自由组合,同源染色体上的基因产生交换与重组,交换的频率随基因间距离的增加而增大。位于同一染色体上的基因在遗传过程中一般倾向于维系在一起,而表现为基因连锁。它们之间的重组是通过一对同源染色体的两个非姊妹染色单体之间的交换来实现的。

假设某一对同源染色体上存在A-a,B-b两对连锁基因,现有两个亲本P1 和P2,它们的基因型分别为AABB和aabb,两亲本杂交产生AaBb双杂合体。F1在减数分裂过程中应产生4种类型的配子,其中两种为亲型配子AB和ab,两种为重组型配子Ab和aB。由于A-a和B-b位于同一染色体上,要产生重组型配子必须在这两个基因的连锁区段上发生交换。重组型配子所占的比例取决于减数分裂细胞中发生交换的频率。交换频率越高,则重组型配子的比例越大。重组型配子最大可能的比例是50%,这时在所有减数分裂的细胞中,在两对基因的连锁区段上都发生交

29

换,相当于这两对基因间无连锁,表现为独立遗传。

重组型配子占总配子的比例称为重组率,用r表示。重组率的高低取决于交换的频率,而两对基因之间的交换频率取决于它们之间的直线距离。重组率的值变化于完全连锁时的0%到完全独立时的50%之间。因此重组率可用来表示基因间的遗传图距,图距单位用厘摩(centi-Morgan,cM)表示,1cM的大小大致符合1%的重组率。

三、图谱制作的统计学原理

(一)两点测验

如果两个基因座位于同一染色体上且相距较近,则在分离后代中通常表现为连锁遗传。对两个基因座之间的连锁关系进行检测,称为两点测验。在进行连锁测验之前,必须了解各基因座位的等位基因分离是否符合孟德尔分离比例,这是连锁检验的前提。在共显性条件下,F2群体中一个座位上的基因型分离比例为1:2:1,而BC1和DH群体中分离比例均为1:1;在显性条件下,F2群体中分离比例为3:1,而BC1和DH群体中分离比例仍为1:1。检验DNA标记的分离是否偏离孟德尔比例,一般采用?2检验。

只有当待检验的两个基因座各自的分离比例正常时,才可进行这两个座位的连锁分析。在DNA标记连锁图谱的制作过程中,常常会遇到大量DNA标记偏离孟德尔分离比例的异常分离现象,这种异常分离在远缘杂交组合的分离群体及DH和RI群体中尤为明显。目前在水稻中已发现了十余个与异常分离有关的基因座位,这些基因座位可能影响配子生活力和竞争力,导致配子选择,从而产生异常分离。

异常分离会使连锁的检验受到影响,一些本来不存在连锁的标记由于各自的异常分离,可能误导得出连锁的结论,而另一些本来连锁着的标记也有可能由于异常分离而无法检测到连锁。发生严重异常分离的标记一般不应用于连锁作图。将分离比的检验与连锁检验相结合,是实际分析过程中解决异常分离的常用方法。

30

两个连锁座位不同基因型出现的频率是估算重组值的基础。在一般的遗传学教材中,重组值的估计是根据分离群体中重组型个体占总个体的比例来估计的。这种估计方法无法得到估计值的标准误,因而无法对估值进行显著性检验和置信区间估计。采用最大似然法进行重组率的估计可解决这一问题。最大似然法以满足其估计值在观察结果中出现的概率最大为条件。

在人类遗传学研究中,由于通常不知道父母的基因型或父母中标记基因的连锁相是相斥还是相引,因而无法简单地通过计算重组体出现的频率来进行连锁分析,而必须通过适当的统计模型来估算重组率,并采用似然比检验的方法来推断连锁是否存在,即比较假设两座位间存在连锁(r < 0.5)的概率与假设没有连锁(r = 0.5)的概率。这两种概率之比可以用似然比统计量来表示,即L(r)/L(0.5),其中L()为似然函数。为了计算方便,常将L(r)/L(0.5)取以10为底的对数,称为LOD值。为了确定两对基因之间存在连锁,一般要求似然比大于1000:1,即LOD>3;而要否定连锁的存在,则要求似然比小于100:1,即LOD<2。

在其它生物遗传图谱的构建中,似然比的概念也用来反映重组率估值的可靠性程度或作为连锁是否真实存在的一种判断尺度。

(二)多点测验

两点测验是最简单,也是最常用的连锁分析方法。然而,在构建分子标记连锁图中,每条染色体都涉及到许多标记座位。遗传作图的目的就是要确定这些标记座位在染色体上的正确排列顺序及彼此间的遗传图距。所以,这里涉及到一个同时分析多个基因座之间连锁关系的问题。这个问题看似简单,其实挺复杂,因为对于m个连锁座位,就有m!/2种可能的排列顺序。例如,若m = 10,则共有1,814,400种可能。要从这么多种可能中挑选出正确的顺序,确实没那么容易。这项工作用两点测验方法是难以完成的,因为它每次只能分析两个座位间的连锁关系。由于两点测验估得的重组率存在误差,因此,根据比较不同座位之间重组率大

31

小来确定座位的排列顺序是不可靠的,很可能存在错误。

为了解决这个问题,就必须同时对多个座位进行联合分析,利用多个座位间的共分离信息来确定它们的排列顺序,也就是进行多点测验。在事先未知各基因座位于哪条染色体的情况下,可先进行两点测验,根据两点测验的结果,将那些基因座分成不同的连锁群,然后再对各连锁群(染色体)上的座位进行多点连锁分析。

与两点测验一样,多点测验通常也采用似然比检验法。先对各种可能的基因排列顺序进行最大似然估计,然后通过似然比检验确定出可能性最大的顺序。在每次多点测验中,不能包含太多的座位,否则可能的排列数会非常大,即使使用高速的计算机,也要花费很长的时间。在一条染色体上,经过多次多点测验,就能确定出最佳的基因排列顺序,并估计出相邻基因间的遗传图距,从而构建出相应的连锁图。

对于在两点测验中没能归类到某个连锁群(染色体)的基因座,可在各连锁群的连锁图初步建成之后,再尝试定位到某个连锁群上。但在构建分子标记连锁图的实际研究中,往往总有一些标记无法定位到染色体上。造成这种现象的原因,主要可能是在测定标记基因型时存在错误。

(三)交换干扰与作图函数

随着间距的增加,两个基因座之间便可能在两处同时发生遗传物质的交换,即双交换。在染色体某区段上发生的双交换,其实际频率往往少于由单交换概率相乘所估得的理论值。这是因为一个位置上所发生的交换会减少其周围另一个单交换的发生,这种现象称为交叉干扰。干扰的程度可用符合系数C表示,符合系数C为实际双交换值与理论双交换值的比值。理论双交换值是指两个相邻的单交换同时独立发生的概率。

实际双交换值 实际双交换值

C= = r1r2 理论双交换值 32

其中r1和r2分别为两个相邻染色体区段发生单交换的概率。符合系数C的值变动于0~1之间。当C=0时,表示完全干扰,没有双交换发生;当C=1时,表示没有干扰,两单交换独立发生。一般而言,两单交换的位置相距越远,则彼此干扰的程度就越低,符合系数就越大。

要计算两个相距较远的基因座之间的图距时,如果中间没有其它基因座可利用,则两个基因座之间实际发生的双交换就不能被鉴别出来,因此,采用一些数学方法进行矫正是必要的,否则,从重组率估计出的图距就会比真实图距小。这种矫正可通过作图函数来实现。

在C=1的假定下,图距x与重组率r之间的关系服从Haldane作图函数:

x=-(1/2)ln(1-2r)

其中x以M为单位。这里M读作Morgan(摩尔根),它是用著名遗传学家摩尔根的姓命名的,并取第一个字母表示。1M=100cM(厘摩),1cM为一个遗传单位,即1%的重组率。根据Haldane作图函数,20%的重组率相当于图距为-(1/2)ln(1-2×0.20)= 0.255M,即25.5cM。

Haldane作图函数的不合理之处在于假定了完全没有交叉干扰。为了将交叉干扰的因素考虑进去,一种比较合理的假设是,双交换符合系数与重组率之间存在线性关系,即C=2r。该式表示,C值随r的增加而增加,干扰相应减弱。当r=0.5(即没有连锁)时,C=1(即没有干扰)。根据这一假设推导出了如下作图函数(Kosambi作图函数): 1+2r x=(1/4)ln 1–2r 根据上式可以算出,当r=0.2时,x=21.2cM。可见Kosambi作图函数算出的图距比Haldane作图函数的小。由于Kosambi作图函

33


分子标记与遗传图谱(7).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:参考材料1:仓库基本规划 -

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: