【原创】微生物LEfSe分析图表解读 返回
一般来说,微生物常见分析内容有OUT丰度分析、OUT Venn图、alpha多样性、RDA/CCA分析、物种系统进化分析、LEfSe分析等等。其中,LEfSe分析在这两年的微生物文章中常常出现。所以,我们今天来重点讲解一下LEfSe分析的原理及图表解读。
LEfSe分析定义
LEfSe分析即LDA Effect Size分析,可以实现多个分组之间的比较,还进行分组比较的内部进行亚组比较分析,从而找到组间在丰度上有显著差异的物种(即biomaker)。
LEfSe分析原理
主要分为三步,如下图:
a.首先在多组样本中采用的非参数因子Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种(a);
b.然后在上一步中获得的显著差异物种,用成组的Wilcoxon秩和检验来进行组间差异分析;
c.最后用线性判别分析(LDA)对数据进行降维和评估差异显著的物种的影响力(即LDA score)。
分析结果
1.LDA值分布柱状图:
展示了LDA score大于设定值有差异的物种,即具有统计学差异的biomaker。展现不同组中丰度有显著差异的物种,柱状图的长度代表显著差异物种的影响大小;
2.进化分支图:
由内至外辐射的圆圈代表了由门至属(或种)的分类级别。在不同分类级别上的每一个小圆圈代表该水平下的一个分类,小圆圈直径大小与相对丰度大小呈正比。
着色原则:无显著差异的物种统一着色为黄色,差异物种 Biomarker跟随组进行着色,红色节点表示在红色组别中起到重要作用的微生物类群,绿色节点表示在绿色组别中起到重要作用的微生物类群,其它圈颜色意义类同。图中英文字母表示的物种名称在右侧图例中进行展示。
3.biomaker在不同组各样本中的丰度比较图:
将biomaker丰度最高的样本的丰度设定为1,其他样品中该 biomarker 的丰度为相对于丰度最高样品的相对值。
LEfSe分析网站
LEfSe分析可以在本地分析也可以在线分析,本地版本只能在linux系统下运行;在线分析的网址是:
https://huttenhower.sph.harvard.edu/galaxy/
LEfSe分析是基于LDA值,很多人会问为什么是不用PCA?PCA与LDA有什么区别?关于这个问题,解释如下:
PCA和LDA的差别在于,PCA,它所作的只是将整组数据整体映射到最方便表示这组数据的坐标轴上,映射时没有利用任何数据内部的分类信息,是无监督的,而LDA是由监督的,增加了种属之间的信息关系后,结合显著性差异标准测试(克鲁斯卡尔-沃利斯检验和两两Wilcoxon测试)和线性判别分析的方法进行特征选择。
参考文献:
Segata N, Izard J, Waldron L, et al. Metagenomic biomarker discovery and explanation[J]. Genome Biol, 2011, 12(6): R60.
更多行业动态,可继续关注我们网站动态发布,同时关注基迪奥微信~扫一扫添加基迪奥好友~随时随地关注行业动态!