友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
86读书 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

普通遗传学-第26章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



体间的表现呈连续变异、很难明确分组、需要用度量等方式来描述的性状,如作物产量,植物的开花期等。由于动植物遗传育种研究中所涉及的绝大多数性状均表现为数量性状的特点,因此对数量性状的遗传特点和规律的研究需要采用数量统计学的方法。
本章将重点介绍数量性状的特点、数量性状遗传以及数量性状位点分析的基本原理与方法。
10。1  数量性状的特征
10。1。1  数量性状的基本特点
数量性状的表现具有两个基本特点,一是个体间的表现差异是用度量单位来表示的,个体间的变异呈连续性,很难明确划分为不同类别。因此这咱变异的特点通常需要采用统计方法加以描述与分析。其二是个体的表现易受环境的影响。具有相同基因型的个体一可能表现出不同的表型,这种基因型与表型的非对应关系使得分析数量性状的遗传规律需要不同于质量性状的方法。
10。1。2  数量性状的遗传基础
毫无疑问,数量性状的遗传也是由基因决定的,但数量性状的遗传是以多基因系统的假定为基础的。尼尔逊…爱尔(Nilsson…Ehle)(1908)根据对小麦籽粒种皮颜色的遗传研究提供了数量性状遗传受多个不同基因控制的经典证据。许多学者随后作了进一步充实和完善试验,提出了数量性状遗传的多基因假说(polygene hypothesis)。Nilsson…Ehle在小麦籽粒种皮颜色的试验中,首先观察到红粒与白粒亲本杂交的F1,表现中间型,F2籽粒则从红到白,表现出程度不同的粒色。进一步发现,在若干个红粒与白粒杂交组合的F2中,如将籽粒简单分为红色和白色两组,不同组合表现的分离比例呈现不同,有的组合为3:1,有的为15:1或63:1。除3:1反映了一对基因的分离外,后两种比例表明存在两对比例表明存在两对或三对基因的重叠作用。因此Nilsson…Ehle推测存在三个位点控制籽粒颜色的形成,每个位点存在一个控制红色、一个控制白色的等位基因,非等位基因间具有累加效应。Nilsson…Ehle同时也观察到上述籽粒的红色还存在深浅程度的差异,这种差异应该与红色基因的数目有关,即每增加一个红色基因,则籽粒的颜色就会更红一些。
若设Aa;Bb;Cc为决定种皮颜色的3对基因,大写表示增加红色,小写表示不增加红色,它们之间没有显隐性关系。则上述杂交F2呈63:1分离的组合亲本基因型之一可为AABBCC×aabbcc;F1
为AaBbCc,其产生的8种雌配子与8种雄配子随机组合的F2合子的基因型及表型可用棋盘格图表示。
从图12…1可以看出,F2基因型种类共33=27种,而种皮颜色可分7种类型,分别带有0;1;2;3;4;5;6个红色基因,籽粒颜色从白到深红,其比例为1:6:15:20:15:6:1;这也是基因型比(1:2:1)3的展开式中各项的系数。其中与亲本相同的基因型(AABBCC,aabbcc)各占1/64。这一推导与所观察到结果完全一致。Nilsson…Ehle的试验结果清楚地表明,控制数量红色素的酶蛋白多少有关,颜色的基因越多,所产生酶蛋白越多,形成的种皮色素就越多,因此表现的种皮颜色就越深。不过,由于该试验中每个粒色基因的效应较大,足以引起表型变异形成一个明显的不连续性分布,因此,他能够用经典孟德尔方法分析该试验数据。











图10…1  Nilsson…Ehle小麦子粒颜色试验中3对加性基因组成7种
表型的棋盘格示意及其频率分布图
(引自Hartl& Jones;2001)
美国遗传学家E。M。East(1913)以烟草(Nicotiana longiflore)花冠长度为研究对象进行的遗传研究极大地丰富了Nilsson…Ehle的数量性状多基因遗传的假说。花冠长度不像粒色性状在F2分离群体中能明确分组归类,而是呈连续性分布。因此,该研究结果不是按孟德尔比例作分析,而采用了生物统计的方法对多个世代群体性状的平均数、方差等参数进行比较,进而发现其遗传规律。
该试验是将花冠平均长度为41。8mm和93。3mm的两个品种作杂交,得到F1。杂种F1花冠平均长度为63。5mm,介于双亲之间。从变异度来看,双亲与杂种F1的方差基本相似。由于亲本是纯系,F1是基因型一致群体,因此,该性状在双亲与杂种F1表现出的变异明显属于非遗传因素所引起的环境变异。F1自交共得到233份F2单株,各单株花冠长度呈连续分布,出现较大的变异范围,其变异度比之亲本和杂种F1的变异度都大(图10…2)。F2中的个体所产生的F3家系表型间存在差异,如图所示将F2中3类植株分别自交获得3类F3家系植株,花冠长度不同的F2植株在F3中出现不同的分布情况,其花冠的平均长度与产生它们的F2植株的长度相当,如来自短花冠的
F2植株后代具有较短的花冠平均值,来自较长花冠的F2植株后代具有较长的花冠平均值,但这些家系的方差(或变异度)存在差异,有的方差极大,有的家系方差较小(图10…2)。这些结果表明,烟草花冠长度在不同世代中的变异既受环境影响,更有基因分离等遗传因素的效应。











图10…2  烟草花冠长度在不同世代的表现频率分布
由此可以得到数量性状多基因假说的几个要点:
(1)数量性状是受许多效应微小的基因控制的;
(2)基因的效应相等且可加;
(3)等位基因间无显隐性关系;
(4)基因的作用受环境影响较大;
(5)微效多基因与质量性状的主基因一样,服从孟德尔的分离、重组等遗传规律。
近年来,借助分子标记技术及饱和连锁图谱,可以分析单个数量性状基因位点在染色体上的位置及遗传效应,许多对动植物的数量性状基因分析的结果表明,数量性状多基因的假说需要完善与补充。其中之一是,数量性状可以是许多微效基因所控制,也可以由少数效应较在的主效基因所决定,各种基因的效应大小可能不等;同时,基因的遗传效应除加性效应外,还有显性效应、上位性效应以及基因与环境互作效应,等等。因此,大多数量性状的遗传基础是比较复杂的,需要采用更多的统计学、生物学等方法来分析。
10。2  基本的统计学概念与分析方法
10。2。1  次数分布
在一个群体中,某一性状的许多观察值通常是连续性变异的(continuous variation);在统计上这些观察值被称为变数或变量,连续改变数的出现都有一定的数量范围。若将其可能出现的整个范围分成若干个互斥的组区间,再来统计出现在各区组间的变量个数(次数),则可能发现一定
的分布规律。这种由不同组区间内变量出现次数组成的分布,就叫变数的次数分布,简称次数分布。次数分布以图来表示,就是次数分布图,通常是以分组数列为横坐标,次数为纵坐标的方柱图或折线图。若将各变量的出现次数除样本容量后可转换为该变量的频率,变量的频率所构成的分布,称频率分布(frequency distribution)。频率分布同样可用图示表示。上节的图10…1、图10…2均显示了性状的频率分布情况。
由次数分布或频率分布可以看到变量分布的两种明显特点,即集中性和离散性。其中平均数(arithmetic mean)是反映集中性的参数,它是某一性状的许多观察值的算术平均。可用公式表示为:
x0=∑xi/n;(i=1;2;…,n)
x0为平均值(或均值),xi为性状的每一个观察值(或变量),n为观察值的总个数或变量数,∑表示求和。
也可利用变量的频率计算平均值,即加权平均数,表达如下式:
x0=∑fixi
fi为某一观察值出现的频率。
反映离散性的参数一般是方差(variance)或标准差(standard deviation)方差是变量与平均数离差的平方和,标准差是方差开平方根植。两者均表示一组变量离开平均数的变异程度。方差越大,各观察值(变数)与平均数间的偏差就越大,反之,观察值与平均数间的偏差就小。总体方差是以变量与平均数间的偏差的平均平方之和来表示,记为O2。通常总体方差是通过样品方差S2来估计的。样品方差用公式表示为:
S2=∑(X2…XO)2/(n…1)='∑x2i…(∑(x2))2/n'/(n…1)
n为观察值的样本数。
另外,生物统计可以用相关系数和协方差等统计参数描述两组或多组遗传上相关的变量之间的相互关系。相关系数(correlation coefficient)是度量两组变量协同变化程度的统计量。将观察到的成对数据按下式可以计算得到相关系数。
rxy=∑(x…x0)(y…y0)/SQR'∑(x…x0)2∑(y…y0)2'
这里x;y为两个变数,x0;y0表示平均数,SQR为平方根。
而乘积和平均,记为协方差(covariance),它反映的也是两组变量协同变化程度或上下代间的依存关系,相关系数与协方差的关系用下式表示:
rxy=COVx。y/sxsy
这里COVx。y=∑(x…x0)(y…y0)/n。
由此可以认为,相关系数是标准化了的协方差。当然,遗传分析中的子代与亲代间的依存关系,也可以用回归系数来描叙。简单的直线回归系数byx表述是以x为自变量,y随着x的一个单位增加(或减少)所改变的单位数。其它义式为:
byx=∑(x…x0)(y…y0)/∑(x…x0)2
现以上述East的烟草花冠长度的遗传研究数据为例,说明数量性状的表型分布特点。表10…1是烟草不同世代单株的花冠长度的数据,经整理后的次数分布表。该表次数分布数据以图形表示就成为了图10…2。根据表中的观察数据,可以容易计算出平均数和方差等参数,如针对亲本P1,观测了49个单株个体一的花冠长度,得到1个观察数在34mm组间内,4个在37mm组间内,18个在40mm左右,16个为43mm,10个落在46mm组间。所以,其加权平均数为(1×34+4×37+18×40+16×43+10×46)/49=41。8,方差为8。56,标准差为2。92;同样其他群体的平均值、方差和标准差也可以获得(见表10…1下三行)。
表10…1  不同世代的花冠长度数据整理为次数分布及参数估计情况
组中点值/mm P1 P2 F1 F2
34 1
37 4
40 18
43 16
46 10
49
52 2
55 4 4
58 10 2
61 41 24
64 75 37
67 40 31
70 3 38
73 35
76 27
79 21
82 5
85 6
88 2 1
91 16
94 32
97 6
100 1
N 49 57 173 233
X0   41。8   93。4    63。5     69。8
S2     8。56     4。97      8。57      46。10
s     2。92     2。23      2。92       6。79

表10…1可以看到,即使是基因型纯合的亲本,每个个体的观察值也是不样的,这种变异明显属于非遗传因素引起的环境变异,其方差的大小反映了该变异的大小。同样可以看到F2代方差比F1代方差及双亲都大,反映出F2代中基因重组分离引起的变异较大。而这种连续分布的变异(幅度)可以直观地在图10…2显示出来。
10。2。2  基因型与表型分布
以控制某一性状的基因对数不同的F2群体的表型分开布为例,如果性状受一对或少数几对基因控制,表现为典型的质量性状,则分组方柱图明显(图10…1),每组基因型与表现型有较好的对应关系;尽管如此,若受非遗传因素的较大影响,不同基因型间的表现会存在相互交错的情况,性状表现的柱形图也会近似于连续性的分布图形;当性状受多对基因控制,许多基因间的差异会减少,加上环境因素的作用,性状表型将呈现连续变异的正太分布,表现出典型的数量性状特征(图10…2),这时从表型的结果推断其基因型会有相当大的困难。正态分布的一个主要特点就是群体中任何个体基因型出现的频率均可用正态分布的密度函数给出,而该密度函数完全决定于该群体的平均数和标准差。换言之,由于数量性状的表型一般呈正态分布,因此,知道了性状在群体中的平均表现和标准差,就可以知道每个个体性状的表型特点。
另外,在众多的生物性状中,有一类特殊的性状,其遗传基础是多基因控制的,但其表现呈非连续性变异,如与动物和人类的患病与健康等相关的性状。一般认为这类性状具有一个潜在的连续型变量分布,以连续分布上的一点(阈值)为界,其表型是间断或不连续的。如人体的易患性,其变异是连续的,但当一个个体易患性达到一定程度(阈值),该个体表现为患病。在一定条件下,阈值标志着患病所必需的最少基因数目的表达。
10。3  数量性状分析的遗传模型
一个数量性状的表型值就是所度量或观察到的数值。可以理解,这个表型值是遗传与环境共同作用的结果。所以,性状的表型值理论上可以剖分为遗传和环境两个组成部分,用数学符号表示为:
P=G+E
其中P为性状的表型值,G为基因型值,E为环境效应。
在一个群体内,环境对个体(基因型)的影响使得个体的表型值偏离基因型值,但由于环境作用效应的方向(如正负值)是随机的,所以就许多个体的平均而言,环境效应等于零,即群体的平均表型值实际上就等于基因型值。
由于基因型反映的是不同位点上等位基因的组成状况。因此,基因型值也可根据基因的组成进一步剖分为:基因的加性效应(additive effect;简写为A)和基因的显性效应或显性离差(dominance effect;D)以及互作效应或上位性(interaction effect;I)。用式子表示为:
G=A+D+I
综合前述的表型值公式,则任何性状的观察值(表型值)可简单地用下列表示:P=A+D+I+E
若忽略基因与环境的互作效应,则
P=A+D+E
它就是数量性状平均数的加性…显性遗传模型。
10。3。1  群体基因型值的平均数
理论上,每个基因型的基因型值可以根据位点上基因的组成计算出来。考虑一个位点上有两个等位基因(如A;a)的情况,在群体中该位点可能存在3种基因型(AA;Aa;aa)其中一种纯合子(AA)的基因型值赋为a;另一种纯合子(aa),的基因型值赋为—a,杂合子基因型值指定d,假定A对性状有增效作用,a对性状有减效作用(注这里的大小写不是通常表示的基因显隐性),则各种基因型如图10…3所示。
基因型

基因型值
图10…3 一个位点一对等位基因的加性…显性效应模型
以两纯合子(亲本)基因型值的平均值(中亲值,记为m)为零,以此为度量点,三种基因型值可认为是距离中亲值的离差,a是基因加性效应与中亲值的离差理论值,d为由基因的显性效应引起的与中亲值的离差。d值大小决定于基因显性程度,若无显性存在,d=0;A对a为显性,d》0;若显性是完全的,则d=a;反之,a对A为显性,则da。
现在考虑群体中各等位基因的频率以及基因型率对基因型均值的影响。假定在一个随机交配的平衡群体中,一对等位基因(A,a)的频率为p和q,则在一个随机交配群体中,群体的平均基因型值计算如表10…2:
表10…2  一个随机交配群体中群体的平均基因型值及频率
基因型 基因型值 频率 频率×基因型值 基因型 基因型值 频率 频率×基因型值
AA a P2 P2a aa …a q2 …q2a
Aa d 2pq 2pq。d 总和 1 P2a+2pqd…q2a
即群体基因型值的平均数(均值)为:
u=(p2a+2pqd…q2a)/(p2+2pq+p2)=(p2a+2pqd…q2a)=(p2…q2)a+2pqd
 =(p+q)(p…q)+2pqd=(p…q)a+2qpd  ( 注意p+q=1)
由上式可知,基因型均值由两部分组成:纯合体效应(p…q)a和杂合体效应2pqd。两部分的大小均与基因频率有关。例如无显性存在,即d=0,则u=(p…q)a=(1…2q)a,基因型均值正好等于群体的基因型频率;若p=q=1/2,则该群体的基因型均值等于1/2d。
以上是以一个位点两对等位基因为例的群体平均数大小,当有n个基因位点作用于同一性状时,假定各基因效应是线性可加的,且忽略非等位基因间的互作,则群体的基因型均值应为:
u=∑(p…q)a+2pqd
10。3。2  群体的方差
若数量性状用简单通式P=G+E表示,则在群体中,可用方差分析将表型变异(方差)剖分为遗传方差和环境方差,即VP=VG+VE,式中VP为表型方差,VG为基因型方差,VE为环境方差。其推导如下:
当P=G+E时:
∑(P…P0)2=∑'(G+E)…(G0+E0)'2=∑(G…G0)2+
∑(E…E0)2+2∑(G…G0)(E…E0)
这里P0,G0,E0分别代表表型、基因型与环境的均值;
各项除以n得:
∑(P…P0)2/n=∑(G…G0)2/n+∑(E…E0)2/n+2∑(G…G0)(E…E0)/n
很显然VP=∑((P…P0)2/n,VG=∑(G…G0)2/n,VE=∑(E…E0)2/n,而COVG;E=∑(G…G0) (E…E0)/n,若G,E不相关,则COVG。E为零,于是:
VP=VG+VE
由于G=A+D+I,同样VG可以进一步分解为加性方差(VA)、显性方差(VD)和上位性方差(V1)等。
分解各种方差分量通常会采用不同的遗传交配设计,即设计亲本间或亲本与子代间的杂交方式,得到不同遗传分离群体,通过对不同世代群体的方差分析,估计出遗传、环境等不同变异的分量。当然,常用的遗传交配设计应该是易于作统计分析,方差成分易于作遗传解释的一些类型,如双亲本杂交设计、双因素遗传设计、回交系统设计以及双列杂交设计等。双亲本杂交类型中的世代群体主要包括纯合体亲本P1、P2以及它们的杂种F1,F1自交得到的F2,以及由F2衍生的许多分离群体如F3,重组自交系(RIL)等。其中,由于纯合体亲和F1为不分离世代,每个群体中个体间的基因型是相同的,理论上个体间无遣传差异,所表现出的差异应该是环境因素引起的。因此不分离世代的基因型方差为零,表型方差等于环境方差。下面就常见的几种分离群体的方差组成作介绍。
10。3。2。1  F2代的方差
根据加性…显性模型,F2群体的遗传方差是由于基因的分离与重组引起的,它又可分为基因的加性效应与显性效应引起的加性方差与显性方差,即群体的基因型方差为加性方差与显性方差之和。若考虑一个位点一对等位基因(A,a)的情况,则F2
返回目录 上一页 下一页 回到顶部 1 1
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!