QIIME2 学习笔记 (一)

来源:互联网 发布:淘宝模特签约合同 编辑:程序博客网 时间:2024/06/05 19:27

本文主要参照QIIME2中文手册,并加入自己的一些理解     https://forum.qiime2.org/t/qiime2-chinese-manual/838 

先来补充一下基础知识(原谅一下我是学计算机的,很多微生物背景知识需要补充)


1. 说下为什么要学习QIIME2

QIIME2是用来做  宏基因组的16S扩增子分析的。这款软件发布于2017年7月,发布才一个月,算是比较新的技术。主要应用在以下几个方面:通过宏基因组测序的方法,将肠道微生物与疾病进行关联分析以揭示疾病与健康个体间的微生物差异;鉴定特定环境中的特定微生物发现耐受菌种及相关基因。可以研究物种的分类,研究与特定环境相关的代谢通路,以及通过不同样品的比较研究微生物群落内部、微生物与环境、微生物与宿主之间的关系。


2. 宏基因组名词解释


宏基因组:宏基因组测序是指对微生物群体进行高通量测序(我的理解是因为很多情况下,微生物群落很难分离,所以只能一堆微生物一起拿来测序分析了),分析特定环境中微生物群体基因组成及功能、微生物群体的多样性与丰度,进而分析微生物与环境、微生物与宿主之间的关系,发现具有特定功能的基因。宏基因组测序无需分离纯培养微生物,较大扩展了微生物资源的利用,为环境微生物群落的研究提供了有效工具。宏基因组深度测序可以揭示或估计环境中真实的物种多样性和遗传多样性,挖掘具有应用价值的基因资源,应用于开发新的微生物活性物质。宏基因组研究分两个方向:扩增子测序和全基因组测序。

扩增子:扩增子(amplicon)为DNA或RNA扩增后的一段核苷酸序列。比如通过PCR扩增得到的某个基因的扩增片段。更简单的说,经过人工扩增的DNA片段或RNA片段、扩增产物。

扩增子测序,涉及特定序列位点的PCR扩增,通常是16S/18S rDNA。宏基因组的物种分类,一般用OUT(operational taxonomic unit),即可操作单元来表示。通常原生生物使用16S rDNA来衡量,真核生物的OUT使用18S rDNA来衡量。我的理解是,选取一段特别的DNA片段来测序,这段DNA还可以区分不同的菌落

为什么用16S,而不是其他15S或者17S呢

16SrRNA为核糖体的RNA的一个亚基,16SrDNA就是编码该亚基的基因。细菌rRNA(核糖体RNA)按沉降系数分为3种,分别为5S、16S和23S rRNA。16S rDNA是细菌染色体上编码 rRNA相对应的DNA序列,存在于所有细菌染色体基因中。
16SrDNA是细菌的系统分类研究中最有用的和最常用的分子钟,其种类少,含量大(约占细菌RNA含量的80%),分子大小适中,存在于所有的生物中,其进化具有良好的时钟性质,在结构与功能上具有高度的保守性,素有“细菌化石”之称。在大多数原核生物中rDNA都具有多个拷贝,5S、16S、23S rDNA的拷贝数相同。16S rDNA由于大小适中,约1.5Kb左右,既能体现不同菌属之间的差异,又能利用测序技术较容易地得到其序列,故被细菌学家和分类学家接受。

沉降系数:沉降系数(sedimentation coefficient)用离心法时,大分子沉降速度的量度,等于每单位离心场的速度。或s=v/(ω^2*r)。s是沉降系数,ω是离心转子的角速度(弧度/秒),r是到旋转中心的距离,v是沉降速度。沉降系数以每单位重力的沉降时间表示,并且通常为1~200×10的-13次方秒范围,10的-13次方这个因子叫做沉降单位s,即1s=10^-13秒,沉降系数对于生物大分子来说,多数在(1~500)×10^-13秒之间,如血红蛋白的沉降系数约为4×10的-13次方秒或4s。


安装过程略过,详细过程可以见  http://blog.csdn.net/woodcorpse/article/details/75103929


原创粉丝点击