Fst指数
来源:互联网 发布:全民天团网络异常 编辑:程序博客网 时间:2024/04/29 14:51
【转】Fst指数
转载自 http://blog.csdn.net/zhu_si_tao/article/details/71513099
与 http://blog.sina.com.cn/s/blog_4ab0b3390102viol.html
群体遗传学--Fst指数,即群体间分化指数,用于群体间分化分析。群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数。Fst指数,由F统计量演变而来。F统计量(FIS,FIT,FST)主要有三种。Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量,基因差异分化系数(gene differentiation coefficient,Gst)。
假定有s个地方群体,第k个地方群体相对大小(占比)为wk。在一个基因座上,第k个地方群体中第i个等位基因频率为qk(i),杂合体频率观察值为hk。那么整个群体中观察到的杂合体频率平均值HI,地方群体为理想群体的期望杂合体频率平均值HS,整个群体为理想群体的期望杂合体频率HT,分别为:
FIS,是HI相对于HS减少量的比值,即地方群体的平均近交系数。
FST,是HS相对于HT减少量的比值,即有亲缘关系地方群体间的平均近交系数。
其中,HS:地方群体为理想群体的期望杂合体频率平均值 HT:整个群体为理想群体的期望杂合体频率
FIT,是HI相对于HT减少量的比值,即整个群体的平均近交系数。
可见,三者在数量上的关系为:
从配子间亲缘关系角度分析,FST和FIT分别相当于地方群体和整个群体中携带的一对等位基因是同源的概率,而FST是从两个地方群体中任意抽取的两个配子是同源的概率。从两个地方群体中任意抽取的两个配子是同源的概率大,表明两个地方群体的遗传组成相似,分化程度低;反义,分化程度高。
FST取值范围[0,1],最大值为1,表明等位基因在各地方群体中固定,完全分化;
最小值为0,意味着不同地方群体遗传结构完全一致,群体间没有分化。
Fst(Fixation index)通常用来衡量population之间的genetic distance。1说明两个population是完全独立的。0说明两个population之间自由interbreeding。Fst值越大,说明genetic distance越远。值越低,说明大多数的genetic variation是发生在同一个population的。
Wright建议,实际研究中,FST为0~0.05:群体间遗传分化很小,可以不考虑;
FST为0.05~0.15,群体间存在中等程度的遗传分化;
FST为0.15~0.25,群体间遗传分化较大;
FST为0.25以上,群体间有很大的遗传分化。
Pi主要用来衡量每个site的nucleotide divergency。
这几个参数同样可以通过vcftools来计算:
vcftools:
vcftools --vcf test.vcf
vcftools --vcf test.vcf
vcftools --vcf test.vcf --weir-fst-pop A2.txt --weir-fst-pop A134567.txt --fst-window-size 3000 --out A2.all.Fst
阅读全文
0 0
- Fst指数
- 群体遗传学--Fst指数
- 群体遗传学--Fst指数
- fst
- FST树
- 指数
- lucene与fst
- FST基本操作
- 求fst的模板程序
- 幸福指数,死亡指数
- java快速序列化库FST
- Fst详解(具体计算步骤)
- 高性能序列化框架FST
- lucene5.1 fst源码分析(BooleanQuery分析)
- lucene5.1 fst源码分析(fst接口方法写入和读取测试)
- 跳楼指数
- 冰激凌指数
- ISM指数
- idea项目上传到git遇到的问题
- python中基础函数
- HDOJ 2109 Fighting for HDU(水题)
- 九九乘法表
- MyBatis的collection集合封装规则
- Fst指数
- python装饰器
- 求10 个数中的最大值
- NOIP2017d2t3 列队 动态开点线段树
- 矩阵(Matrix)
- ubuntu下配置opencv
- 结果集映射(一)
- 使用vim打开文件时tab补全忽略大小写设置
- Plant