多项式分布解决异源四倍体测序克隆数

来源:互联网 发布:软通动力java面试题 编辑:程序博客网 时间:2024/06/06 07:33

异源多倍体(allopolyploid)是指不同的种杂交产生的杂种后代,经过染色体加倍形成的多倍体

异源多倍体,生物学名词,指不同物种杂交产生的杂种后代经过染色体加倍形成的多倍体。常见的多倍体植物大多数属于异源多倍体,例如,小麦、燕麦、棉、烟草、苹果、梨、樱桃、菊、水仙、郁金香等。对应的有同源多倍体,同一物种经过染色体加倍形成的多倍体,称为同源多倍体。

 异源多倍体可以通过人工的方法进行培育。例如,萝卜和甘蓝是十字花科中不同属的植物,它们的染色体都是18条(2n=18),但是二者的染色体间没有对应关系。将它们杂交,得到杂种F1。F1在产生配子时,由于萝卜和甘蓝的染色体之间不能配对,不能产生可育的配子,因而F1是高度不育的。但是如果由F1的染色体数目没有减半的配子受精,或者用秋水仙素处理,人工诱导F1的染色体加倍,就可以得到异源四倍体。在异源四倍体中,由于两个种的染色体各具有两套,因而又叫做双二倍体。这种双二倍体既不是萝卜,也不是甘蓝,它是一个新种,叫做萝卜甘蓝。很可惜,萝卜甘蓝的根像甘蓝,叶像萝卜,没有经济价值。但是,这却提供了种间或属间杂交在短期内(只需两代)创造新种的方法。通过这种方法,人们已经培育出越来越多的异源多倍体新种。


问题:

异源四倍体需要多少克隆能把几乎所有单倍型包括,就相当于从装四个不同颜色球的袋子里,有放回的抽取,需要抽多少次,才能保证四种颜色的球都被抽取到的概率大于等于0.95。


这就相当于求X1+X2+X3+X4=N,P(X1>=1,X2>=1,X3>=1,X4>=1)的概率。N为抽取次数,Xi表示抽到其中一种颜色的的次数。

则有

(1)



(2)可以用如下公式来求


(3)


在R中有处理多项分布的函数dmultinom(x=x,prob=prob)

x=c(1,2,3,4)prob=c(.25,.25,.25,.25)dmultinom(x=x,prob=prob)

prob(probability) 表示概率,x表示抽取到的次数,上边的代码的含义是:总共进行了1+2+3+4=10次有放回的抽取,第一种颜色抽取到一次,第二种颜色抽取到2次,第三种3次,第四种颜色4次,每种颜色被抽取到的概率都是0.25,在R中经常用".25",".34"来简写0.25 ,0.34。



为了求式(1) 需要写点简单的代码,由于生物问题比较简单,只需要四倍体的结果就可以了,而且还知道大概次数范围,就没有写个递归程序,连参数都需要手动设定。

以下就是非常简单的代码

n<-16;sum<-0;for(i in 1:n){for(j in 1:n){for(k in 1:n){for ( l in 1:n){x=c(i,j,k,l);if(i+j+k+l==n){print (c(i,j,k,l));sum<-sum+dmultinom(x=x,prob=prob);}}}}}print(sum);

最终结果如下:









参考文献:http://fhqdddddd.blog.163.com/blog/static/186991542011324114044161/



0 0