Nature:拟南芥微生物组功能研究2细菌基因组测序和分析

来源:互联网 发布:如何测试80端口 编辑:程序博客网 时间:2024/04/30 12:21

本网对Markdown排版支持较差,请跳转植物微生物组公众号阅读

背景介绍

Bai, Y., et al. (2015). “Functional overlap of the Arabidopsis leaf and root microbiota.” Nature 528(7582): 364-369.

image

本文是2015末发表在Nature的Article文章,第一作者为白洋,主要负责拟南芥根相关菌分离、培养、测序和人工重组实验,现中科院遗传发育所研究员;共一的第四作者Ruben Garrido-Oter,主要负责细菌鉴定、基因组和扩增子分析,现马普植物育种所Group Leader。通讯作者分别为德国马普植物育种所的Paul Schulze-Lefert教授和瑞士苏黎士微生物所的Julia A. Vorholt教授。

由于本文内容极多,分为四篇文章进行介绍:
- 0概述
- 1细菌分离培养鉴定
- 2细菌基因组测序和分析
- 3人工重组微生物群落

本文是此系列的第三篇:2细菌细菌基因组测序和分析

细菌基因组组装和注释

上一篇文章中分离、培养、鉴定的单菌,筛选非冗余的菌进行DNA提取,并建库测序。
测序结果采用Trimmomatic v. 0.33进行质量控制。高质量的测序数据采用A5和SOAPdenovo v. 20.1两个软件进行独立组装,选择组装Scaffold数量最少结果用于进一步分析。组装结果统计信息见原文补充数据3和4。使用GLIMMER v. 3.02预测基因和注释基因组。基因的功能注释采用Prokka v. 1.11,其中的SEED子系统方法采用RAST服务器API。采用HMMER tookit v. 3.1b2对基因进行KEEG同源分组注释。

image
图3. 分析测序单菌基因组的功能
a, 科水平细菌的进化树。注释的信息分别为簇ID,分类学科名称,和叶、根、土中的分离菌数量;热图展示基因功能分类所占的百分比。b, 功能富集分析叶、根和土中注释的蛋白。图中点和线代表平均丰度和标准变异。P values采用无参的Mann-Whitney test,并用Bonferroni approach检验。c, 分析同科菌的泛基因组,分为三类,全体共有分为core,部分有为shell,某菌特有为singletons

测序细菌基因组的进化分析

每个基因组中的蛋白组中,鉴定31个保守的、单拷贝的AMPHORA基因,用于高精度的系统发生树构建。使用Clustal Omega将31个基因的多序列比对结果合并。并采用FastTree的最大似然树法生成树。基于全基因组序列,采用taxator-tk进行物种分类注释。

进化分析碳水化合物代谢基因

image
Extended Data Figure 5 | 分离测序菌碳水化合物代谢基因的系统发生分布。 a, 系统发生树基于叶(206)根(194)土(32)所有测序菌的31个保守的AMPHORA标记基因。图中每枝末端形状表示分离来源,颜色表示其分类为门水平或纲。背影色表示为同一科并标示了科名;b, 柱状图表示这些基因在该所物种所有注释碳水化合物蛋白中所占比例。

进化分析xenobiotic降解基因

image
Extended Data Figure 6 | 分离测序菌xenobiotic降解基因的系统发生分布。 a, 系统发生树基于叶(206)根(194)土(32)所有测序菌。图中每枝末端形状表示分离来源,颜色表示其分类为门水平或纲。背影色表示为同一科并标示了科名;b, 柱状图表示这些基因在该所物种中注释xenobiotic降解基因所占比例。

分析测序单菌的功能多样性

分析多样性分三步:原始数据矩阵、距离矩阵、PCoA可视化。

原始数据矩阵,即表达或丰度矩阵:原理和分析菌群多样性类似,OTU表中为样品对应每个OTU的reads count;RNA-Seq的表达矩阵为样品中每个基因的表达。现在是单菌基因组中,每个菌中KO(KEGG Orthologue)分类的基因数量构成的丰度矩阵。

距离矩阵:之前多样性分析菌群OTU时采用bray curtis, unifrac等距离计算方法。现在KO则采用Perason相关系数计算两两细菌基因组间的相关性,转换为相似度矩阵。

PCoA:采用R语言对相关系数矩阵进行平面展示。
同理,细菌还可以按分类学水平进行合并或求平均值,类似于Taxonomy不同水平的分类统计,再计算不同分类级别下,各物种或分类水平上的功能差异。
富集的KO通路采用无参数的Mann–Whitney Test (MWT)统计方法,并采用多重Bonferroni方法进行多重检验,显著性阈值为0.05。

image
图2. 分析测序单菌基因组的功能多样性
a, PCoA描述测序基因的KEGG功能距离,每个点代表一个基因组,颜色标准为菌的来源,形状是其分类信息;图中数字为某一细菌家族的成员数。
b, 采用家族间两两距离展示细菌家族内的功能多样性;更高的距离表示其科内功能多样性丰富。只有科内至少5个以上成员才展示。柱状图展示所有基因组科内多样性分布密度图;箱线图展示每个科内每个基因组的多样性距离分布;

拟南芥分离细菌基因组与葡萄宏基因比较

image
Extended Data Figure 7 | 葡萄宏基因组比较;a,b, 葡萄宏基因组(47)和拟南芥分离细菌基因组(432)的功能富集分析;采用箱线图展示各物种中根、土中主要功能类别的比例分布。

阅读更多微生物组文章,欢迎扫码关注“植物微生物组”
image

阅读全文
0 0
原创粉丝点击