扩增子分析QIIME2. 3粪便菌群移植FMT分析实战

来源:互联网 发布:阿里云市值 编辑:程序博客网 时间:2024/04/29 03:12

声明:本文为QIIME2官方帮助文档的中文版,由中科院遗传发育所刘永鑫博士翻译并亲测有效,文档翻译己获QIIME2团队官方授权。由于QIIME2更新频繁,如使用中遇到问题请访问QIIME2官方论坛阅读最新版中文帮助。
https://forum.qiime2.org/t/qiime2-1-chinese-manual/838
如中文翻译没有急时更新,新阅读英文原版 https://docs.qiime2.org

本人只习惯使用命令行模式分析数据,图形界面和Ipython模式下使用暂不介绍。本系列的教程主要以命令行方式为大家演示。在其它方面有使用的经验的朋友,欢迎共享您的使用笔记于“宏基因组”公众号,方便大家学习和使用。

扩增子分析QIIME2. 3粪便菌群移植分析

原文地址: https://docs.qiime2.org/2017.6/tutorials/fmt/

此实例需要一些基础知识,要求完成本系列文章前两篇内容:1简介和安装和2分析实战Moving Pictures。

本实验研究自闭症且胃肠道功能紊乱患者,采用粪便菌群移植方法,来降低患者的行为异常和肠道紊乱。监测移植后18个月范围内肠道菌群的变化,采用MiSeq PE300测序技术。

实验数据下载

# 激活工作环境source activate qiime2-2017.6# 创建工作目录并下载实验设计mkdir qiime2-fmt-tutorialcd qiime2-fmt-tutorialwget -O "sample-metadata.tsv" "https://data.qiime2.org/2017.6/tutorials/fmt/sample_metadata.tsv"# 下载成功跳过此步,下载失败处理方法:因为中国大陆用户没没有访问google的权限,请删除空文件,并下载备用链接rm sample-metadata.tsvwget http://bailab.genetics.ac.cn/markdown/QIIME2/sample-metadata.tsv# 下载实验数据,为演示分析,只使用原始数据10%的抽样结果,如果下载失败请重试即可。wget -O "fmt-tutorial-demux-1.qza" "https://data.qiime2.org/2017.6/tutorials/fmt/fmt-tutorial-demux-1-10p.qza"wget -O "fmt-tutorial-demux-2.qza" "https://data.qiime2.org/2017.6/tutorials/fmt/fmt-tutorial-demux-2-10p.qza"

序列质控评估

# 序列质量评估qiime demux summarize \  --i-data fmt-tutorial-demux-1.qza \  --o-visualization demux-summary-1.qzvqiime demux summarize \  --i-data fmt-tutorial-demux-2.qza \  --o-visualization demux-summary-2.qzv# 查看质量评估结果,用于确定下步质控的参数qiime tools view demux-summary-1.qzvqiime tools view demux-summary-2.qzv

查看可视化评估结果,也可下载qzv文件,使用 view.qiime2.org 打开查看,或直接打开作者在线预计算好的结果。 https://view.qiime2.org/?src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Ffmt%2Fdemux-summary-1.qzv
image

问题:从上图中我们判断选择质控的参数是什么?
序列上游13 bp的序列质量偏低,设置trim-left 13截掉前13bp序列;整体150bp的质量都不错,则保留150 bp的序列长度。

Feature表和代表性序列生成

# dada2去质控和去冗余,本实验有两批独立的数据,需要处理两次,生成代表序列和OTU表qiime dada2 denoise-single \  --p-trim-left 13 \  --p-trunc-len 150 \  --i-demultiplexed-seqs fmt-tutorial-demux-1.qza \  --o-representative-sequences rep-seqs-1.qza \  --o-table table-1.qzaqiime dada2 denoise-single \  --p-trim-left 13 \  --p-trunc-len 150 \  --i-demultiplexed-seqs fmt-tutorial-demux-2.qza \  --o-representative-sequences rep-seqs-2.qza \  --o-table table-2.qza

合并不同组的序列和表

# 合并两组数据和OTU表qiime feature-table merge \  --i-table1 table-1.qza \  --i-table2 table-2.qza \  --o-merged-table table.qza# 合并两组数据的代表性序列qiime feature-table merge-seq-data \  --i-data1 rep-seqs-1.qza \  --i-data2 rep-seqs-2.qza \  --o-merged-data rep-seqs.qza# OTU表统计qiime feature-table summarize \  --i-table table.qza \  --o-visualization table.qzv \  --m-sample-metadata-file sample-metadata.tsv# 查看Feature/OTU表的统计结果qiime tools view table.qzv# 代表性序列统计qiime feature-table tabulate-seqs \  --i-data rep-seqs.qza \  --o-visualization rep-seqs.qzv# 查看代表性序列的统计结果qiime tools view rep-seqs.qzv

table.qzv文件中Feature/OTU表统计的结果如下,或在线查看详细信息:https://view.qiime2.org/visualization/?type=html&src=https%3A%2F%2Fdocs.qiime2.org%2F2017.6%2Fdata%2Ftutorials%2Ffmt%2Ftable.qzv

OTU表总结

Metric Sample Number of samples 121 Number of features 337 Total frequency 48,925

样品数据量分布

Type Frequency Minimum frequency 84.0 1st quartile 276.0 Median frequency 380.0 3rd quartile 492.0 Maximum frequency 860.0 Mean frequency 404.3388429752066

特征表频率统计

Type Frequency Minimum frequency 2.0 1st quartile 9.0 Median frequency 24.0 3rd quartile 85.0 Maximum frequency 10,832.0 Mean frequency 145.1780415430267

通过上表,我们可以确定Feature特征表标准化的重抽样数据,由于本测试,只用了文章原始数据的10%的数据,数据量很小,最小值为84,第一分位数为276,我们可选择276保留75%以上的样品。一般最小值最少1000,推荐5000以上。

多样性分析

现在我们已经获得了特征表(Feature/OTU),以及代表性序列(Feature Seq)
自己尝试用上篇文章的分析方法,回答下面这些问题。

前两节课的知识应该可以回答下面的问题,过两天我也会分析并做出答案。大家一定要实操才有真正分析的能力,想不出来就多操作和思路上一篇分析。

  1. 个人微生物组;
    1. 按subject-id分类存在组成差异?
    2. 按subject-id分类存在丰富度差异?
    3. 按subject-id分类存在均匀度差异?
  2. 菌群移植;
    1. 移植几周后,患者的菌群在unweighted unifrac距离下最像供体;
    2. 移植几周后,患者的菌群在bray-curtis距离下最像供体;
    3. 比较两种距离结果那种解释更好;
  3. 实验设计:比较粪便和试子样品采集方法
    1. 比较不同取样方法结果中最大差别的类别?差异类别用blast,或classifier注释有什么不同?
    2. 两类样品的unweighted unifrac和bray-curtis间有什么不同?
    3. 供体粪便与那种取样的结果更像?
    4. 两类取样方法的Alpha多样性存在差别吗?
  4. 每个测序Run中有多少样品?在不同测序Run中是否存在系统性差异?

Reference

  1. https://docs.qiime2.org/2017.6/tutorials/fmt/
  2. The data in this tutorial was initially presented in: Microbiota Transfer Therapy alters gut ecosystem and improves gastrointestinal and autism symptoms: an open-label study. Dae-Wook Kang, James B. Adams, Ann C. Gregory, Thomas Borody, Lauren Chittick, Alessio Fasano, Alexander Khoruts, Elizabeth Geis, Juan Maldonado, Sharon McDonough-Means, Elena L. Pollard, Simon Roux, Michael J. Sadowsky, Karen Schwarzberg Lipson, Matthew B. Sullivan, J. Gregory Caporaso and Rosa Krajmalnik-Brown. Microbiome (2017) 5:10. DOI: 10.1186/s40168-016-0225-7.

想了解更多16S/ITS/18S扩增子、宏基因组、宏转录组文献阅读和分析相关文章,快关注“宏基因组”公众号,干货第一时间推送。
image

系统学习生物信息,快关注“生信宝典”,那里有几千志同道合的小伙伴一起学习。
image

阅读全文
0 0
原创粉丝点击