REML-Based Diallel Analysis

来源：互联网发布：干扰手机信号软件编辑：程序博客网时间：2024/05/07 04:00

模型不同，试验设计不同，双列分析的结果也不同。提出了一个general模型。如果方差-协方差的assumption不fulfilled，用随机遗传效应获得的方差是有偏的。

双列交配设计广泛应用到植物育种中，能够评估育种群体中亲本的表现，并能发现最优潜力（the most promising）的交配组合。
按照（depending on）目的和假设，遗传效应可以做固定也可以作随机。
当有 $n$ 个亲本，会得到 $n^2$ 个combination，这些combination可以分成n(n-1)个cross，包括正反交和n个自交(selfed parents)。
对于完全近交的亲本，亲本与自交的亲本是遗传一致的。
根据测定哪些combination，Griffing分成4种实验方法。
对这4种方法的统计分析，可以基于不同的模型，利用ANOVA，OLS，MINQUE，和REML。
对于reciprocal crosses，griffing定义了一个specific reciprocal （RSCA） 效应。cockerman等扩展了这个方法，通过定义reciprocal GCA （RGCA） 效应和reciprocal SCA （RSCA）效应。hayman 假设了一个平均显性离差deviation或者杂种优势效应，定义作自交亲本和crosses均值之间的差值。
gardner只对crosses定义了SCA效应，GCA效应分成2个效应，一个是全部combination，一个是只有crosses。这允许一个直接解释作加性和非加性遗传效应。
对于方法4，所以模型结果一致，对于有自交或正反交的方法，结果彼此不同，也不清楚哪个最好。

材料方法

Proposed模型描述

为引入线性混合模型用于双列杂交分析，我们首先考虑xiang and li 2001提出的方法4的一个模型，它是最简单的双列交配模型。然后再讨论如何扩展到更多的复杂情况。

y i j k l m = T i + B j (i) + P k l (j i) + G F k + G F l + S k l + (T G) F i k + (T G) M i k + (T S) i k l + E i j k l m

[1]
$T$ 、 $B$ 、 $P$ 分别是地点、区组和小区， $E$ 是残差。模型为全部crosses假定一个共有的群体均值。 $G_{k}^F$ 是母本 $k$ 的随机主效应， $G_{l}^M$ 是母本 $l$ 的随机主效应。给母本和父本分别加上标是为了区分2个主效应类型。
$S_{kl}$ 是亲本 $k$ 和 $l$ 间cross的随机效应。由于模型假定没有正反交GCA和正反交SCA效应，这里 $G_{k}$ 就是亲本 $k$ 的GCA效应， $S_{kl}$ 就是亲本 $k$ 和 $l$ 间cross的随机效应。括号中的效应是对应的交互效应。一个母本是 $k$ ，父本是 $l$ 的基因型（子代个体）的遗传效应可以写作：

g_{kl}=G_{k}^F+G_{l}^M+S_{kl}   [2]

如果存在RGCA，亲本主效应 $G_{k}$ 可以分成一个GCA效应和一个RGCA效应如cockerham1977描述。RGCA的一些参数化是可能的这里我们依照Hayman1954，他定义RGCA为父母本 $G_{k}$ 效应间差值的一半，即，母本

G_{k}^F=gca_k+rgca_k    [3]

父本

G_{k}^M=gca_k-rgca_k    [4]

$gca_k$ 是亲本 $k$ 的GCA效应， $rgca_k$ 是亲本 $k$ 的RGCA效应。在独立的随机效应假设下， $gca_k \sim N(0,\sigma _{gca}^2)$ ， $rgca_k \sim N(0,\sigma _{rgca}^2)$ 父母本的亲本主效应 $G_{k}$ 是相关的，因为有相同GCA和相反的正反交GCA效应存在。2个亲本主效应 $G_{k}^F$ 和 $G_{k}^M$ 有一个对称的2×2方差-协方差矩阵，对角线上是 $\sigma _{gca}^2+\sigma _{rgca}^2$ ， $\sigma _{gca}^2-\sigma _{rgca}^2$ 作为协方差。忽略正反交GCA效应，矩阵就缩减为一个 $J_2 \sigma _{rgca}^2$ 矩阵， $J_2$ 是一个2×2元素为1的矩阵。可因为 $S_{kl}$ 效应假定一个analogous结构，区分来自同一个亲本的crosses和反交。于是这个效应就可以分解为 $S_{kl}=sca_{kl}+rsca_{kl}$ ， $sca_{kl}$ 是亲本 $k$ 和 $l$ 的SCA效应， $rsca_{kl}$ 是母本 $k$ 和父本 $l$ 的正反交SCA（RSCA）效应， $sca_k \sim N(0,\sigma _{sca}^2)$ ， $rsca_k \sim N(0,\sigma _{rsca}^2)$ 。如果我们提出限制 $rsca_{kl}=-rsca_{lk}$ ，那么2个效应 $S_{kl}$ 和 $S_{lk}$ 有一个对称的2×2方差-协方差矩阵，对角线上是 $\sigma _{sca}^2+\sigma _{rsca}^2$ ， $\sigma _{sca}^2-\sigma _{rsca}^2$ 作为协方差。
方法2的crosses的遗传效应可以写作：

g_{kl}=gca_k+gca_l+rgca_k-rgca_l+sca_{kl}+\beta_{kl}rsca_{kl}   [5]

反交 $\beta_{kl}=-1$ ，正交 $\beta_{kl}=1$ ，其他情况 $\beta_{kl}=0$ ,。
模型2可以扩展为包括自交亲本。加入自交亲本的最简单的模型为自交亲本假定一个分离均值和一个简单效应 $L_k$ ，第 $k$ 个自交亲本， $L_k\sim N(0,\sigma _{L}^2)$ 。可以进一步假定 $L_k$ 与同一个亲本相应的 $gca_k$ 相关。有可能为二者拟合一个无结构的2×2方差-协方差矩阵，对角线元素 $\sigma _{gca}^2$ ， $\sigma _{L}^2$ ，和一个分离的协方差。通过模型3可以描述遗传效应：

g_{kl}=\delta_{kl}(gca_k+gca_l+sca_{kl}+rgca_k-rgca_l+\beta_{kl}rsca_{kl})+(1-\delta_{kl})(\phi+L_k)    [6]

$\phi$ 是crosses和自交亲本均值间的差，自交亲本 $\delta_{kl}=0$ ，其他基因型 $\delta_{kl}=1$ 。注意自交亲本效应 $L_k$ 只有一个下标k，因为对于自交亲本k=l。模型3适合于方法1，去掉RGCA和RSCA就可以用于方法2。

与其他模型的比较

模型3为自交亲本效应（ $\sigma _{L}^2$ ）和crosses（ $\sigma _{gca}^2, \sigma _{rgca}^2, \sigma _{sca}^2, \sigma _{rsca}^2$ 假定了独立的方差组分。进一步可以假定自交亲本和GCA效应间的协方差。

软件执行

对于更小的数据集，提出的模型可以在SAS环境中执行，利用PROC MIXED或者PROC GLIMMIX。在PROC GLIMMIX中，双列杂交种亲本的GCA效应可以利用新的多-成员函数通过一个效应声明模型。于是声明

EFFECT gca=mm(female male);RANDOM gca;

估计由变量female和male代码的亲本的随机GCA效应。
在PROC MIXED中需要给每个亲本一个虚拟变量，是为了保证给2个亲本估计相同的方差。我们将称它们为第n个亲本的col1-coln。这些变量初始值为0，每次加1无论对应的亲本是用于母本还是父本。SAS对GCA效应的声明是

RANDOM col1-coln/TYPE=toep(1);

这个声明在PROC MIXED and PROC GLIMMIX中都适用。
此外，为了执行Model (3)，需要2个进一步的虚拟变量集。我们把第一个集编码为l1-ln，给自交亲本的效应；第二个集合编码为rgca1-rgcan，给正反交GCA效应。第一个集中的虚拟变量li (i=1,..,n)等于1如果亲本i用作组合中的母本或父本，否则li=0。虚拟变量rgcai=1为crosses，=-1为反交，其余=0。为了估计GCA效应和响应的自交亲本效应间的一个协方差，一个线性协方差结构用选项TYPE=lin(3)来执行是需要的。如果GCA效应和自交亲本效应根据亲本排序，所有的GCA效应放在随机声明的前头，随后的方差-协方差结构被拟合

\left(\begin{array}{cc}I_{n} & 0_n \\0_n & 0_n \end{array} \right)\sigma_{gca}^2+\left(\begin{array}{cc}0_n  & 0_n \\0_n & I_{n}\end{array} \right) \sigma_{selfed\_parents}^2+\left(\begin{array}{cc}I_n  & 0_n \\0_n & I_n\end{array} \right)\sigma_{gca;selfed\_parents}

In是大小为n的单位矩阵，0n是一个n×n的0矩阵， $\sigma_{gca}^2$ 是GCA效应方差， $\sigma_{gca;selfed\_parents}^2$ 是自交亲本效应方差， $\sigma_{gca;selfed\_parents}$ 是二者的协方差。

为了区分自交亲本、正交和反交，需要虚拟变量d1, d2 and dr。d1中自交=0，正反交=1；d2中自交=1，正反交=0。dr中正交=1，反交=-1。为了给自交亲本和正反交估计独立的均值(因此模型一个heterosis效应)，为了模型checks的效应，如果可用的话，变量check随着一个分离水平给每个基因型组，每个check是需要的(Piepho et al., 2006).。变量组合给所有可能的亲本组合一个stage，不考虑亲本的性别。于是在一个全双列中，相同亲本的正反交是相同的组合。

$n^2$
$\Delta$
$\epsilon$
$n \times n$

0 0