Nature:拟南芥微生物组功能研究2细菌基因组测序和分析
来源:互联网 发布:如何测试80端口 编辑:程序博客网 时间:2024/04/30 12:21
本网对Markdown排版支持较差,请跳转植物微生物组公众号阅读
背景介绍
Bai, Y., et al. (2015). “Functional overlap of the Arabidopsis leaf and root microbiota.” Nature 528(7582): 364-369.
本文是2015末发表在Nature的Article文章,第一作者为白洋,主要负责拟南芥根相关菌分离、培养、测序和人工重组实验,现中科院遗传发育所研究员;共一的第四作者Ruben Garrido-Oter,主要负责细菌鉴定、基因组和扩增子分析,现马普植物育种所Group Leader。通讯作者分别为德国马普植物育种所的Paul Schulze-Lefert教授和瑞士苏黎士微生物所的Julia A. Vorholt教授。
由于本文内容极多,分为四篇文章进行介绍:
- 0概述
- 1细菌分离培养鉴定
- 2细菌基因组测序和分析
- 3人工重组微生物群落
本文是此系列的第三篇:2细菌细菌基因组测序和分析
细菌基因组组装和注释
上一篇文章中分离、培养、鉴定的单菌,筛选非冗余的菌进行DNA提取,并建库测序。
测序结果采用Trimmomatic v. 0.33进行质量控制。高质量的测序数据采用A5和SOAPdenovo v. 20.1两个软件进行独立组装,选择组装Scaffold数量最少结果用于进一步分析。组装结果统计信息见原文补充数据3和4。使用GLIMMER v. 3.02预测基因和注释基因组。基因的功能注释采用Prokka v. 1.11,其中的SEED子系统方法采用RAST服务器API。采用HMMER tookit v. 3.1b2对基因进行KEEG同源分组注释。
图3. 分析测序单菌基因组的功能
a, 科水平细菌的进化树。注释的信息分别为簇ID,分类学科名称,和叶、根、土中的分离菌数量;热图展示基因功能分类所占的百分比。b, 功能富集分析叶、根和土中注释的蛋白。图中点和线代表平均丰度和标准变异。P values采用无参的Mann-Whitney test,并用Bonferroni approach检验。c, 分析同科菌的泛基因组,分为三类,全体共有分为core,部分有为shell,某菌特有为singletons
测序细菌基因组的进化分析
每个基因组中的蛋白组中,鉴定31个保守的、单拷贝的AMPHORA基因,用于高精度的系统发生树构建。使用Clustal Omega将31个基因的多序列比对结果合并。并采用FastTree的最大似然树法生成树。基于全基因组序列,采用taxator-tk进行物种分类注释。
进化分析碳水化合物代谢基因
Extended Data Figure 5 | 分离测序菌碳水化合物代谢基因的系统发生分布。 a, 系统发生树基于叶(206)根(194)土(32)所有测序菌的31个保守的AMPHORA标记基因。图中每枝末端形状表示分离来源,颜色表示其分类为门水平或纲。背影色表示为同一科并标示了科名;b, 柱状图表示这些基因在该所物种所有注释碳水化合物蛋白中所占比例。
进化分析xenobiotic降解基因
Extended Data Figure 6 | 分离测序菌xenobiotic降解基因的系统发生分布。 a, 系统发生树基于叶(206)根(194)土(32)所有测序菌。图中每枝末端形状表示分离来源,颜色表示其分类为门水平或纲。背影色表示为同一科并标示了科名;b, 柱状图表示这些基因在该所物种中注释xenobiotic降解基因所占比例。
分析测序单菌的功能多样性
分析多样性分三步:原始数据矩阵、距离矩阵、PCoA可视化。
原始数据矩阵,即表达或丰度矩阵:原理和分析菌群多样性类似,OTU表中为样品对应每个OTU的reads count;RNA-Seq的表达矩阵为样品中每个基因的表达。现在是单菌基因组中,每个菌中KO(KEGG Orthologue)分类的基因数量构成的丰度矩阵。
距离矩阵:之前多样性分析菌群OTU时采用bray curtis, unifrac等距离计算方法。现在KO则采用Perason相关系数计算两两细菌基因组间的相关性,转换为相似度矩阵。
PCoA:采用R语言对相关系数矩阵进行平面展示。
同理,细菌还可以按分类学水平进行合并或求平均值,类似于Taxonomy不同水平的分类统计,再计算不同分类级别下,各物种或分类水平上的功能差异。
富集的KO通路采用无参数的Mann–Whitney Test (MWT)统计方法,并采用多重Bonferroni方法进行多重检验,显著性阈值为0.05。
图2. 分析测序单菌基因组的功能多样性
a, PCoA描述测序基因的KEGG功能距离,每个点代表一个基因组,颜色标准为菌的来源,形状是其分类信息;图中数字为某一细菌家族的成员数。
b, 采用家族间两两距离展示细菌家族内的功能多样性;更高的距离表示其科内功能多样性丰富。只有科内至少5个以上成员才展示。柱状图展示所有基因组科内多样性分布密度图;箱线图展示每个科内每个基因组的多样性距离分布;
拟南芥分离细菌基因组与葡萄宏基因比较
Extended Data Figure 7 | 葡萄宏基因组比较;a,b, 葡萄宏基因组(47)和拟南芥分离细菌基因组(432)的功能富集分析;采用箱线图展示各物种中根、土中主要功能类别的比例分布。
阅读更多微生物组文章,欢迎扫码关注“植物微生物组”
- Nature:拟南芥微生物组功能研究2细菌基因组测序和分析
- Nature:拟南芥微生物组功能研究1培养组学—高通量细菌分离培养鉴定
- Nature:拟南芥微生物组功能研究0概述
- Nature:拟南芥微生物组功能研究3人工重组微生物群落
- 扩增子文献笔记2拟南芥根微生物组的结构和组成
- Nature:地球微生物组计划首发成果
- 微生物测序分析LEfSe
- 细菌、真菌与微生物
- Nature Reviews:拥抱未知:解析土壤微生物组的复杂性
- Microbiome:微生物组研究中优化方法和规避误区
- 植物微生物组培养与重组技术:从描述性研究走向功能性研究
- antiSMASH数据库:微生物次生代谢物合成基因组簇查询和预测
- 【测序实验】-CS0100-《用于高通量测序研究的人体微生物样品收集、处理、运输和储存规范》
- 1003个微生物基因组数据发布
- ENCODE30篇论文全摘要 聚焦人基因组功能研究
- 植物MWAS研究—小米产量与微生物组关联分析
- 全基因组重测序数据分析
- 后基因组时代的基因组功能注释
- 引导页
- Python3之无法在进程池中使用队列Queue的解决方案
- 幻方判定
- 使用GDI+加载PNG(MFC)
- 侧
- Nature:拟南芥微生物组功能研究2细菌基因组测序和分析
- 如何将音频放慢
- 四种补间动画,组合动画
- 左右侧拉
- Python安装和运行Scrapy中的两个问题
- 介绍——基于类的视图(class-based view)
- 集合各实现类的底层实现原理
- Frangment+动画+listview
- 属性动画Animator