差异丰度分析方法基准测试
【资料图】
差异丰度分析(DAA)是微生物组数据分析中一项中心统计任务,相关微生物组数据的DAA(DAA-C)工具可有效筛选微生物候选物,便于进一步的验证。今年1月,《Briefings in Bioinformatics》发表综述文章,使用基于真实数据的模拟对现有DAA-C工具进行了首次全面评估。
//
DAA的目标是确定其丰度与感兴趣变量相关的微生物特征。纵向微生物组研究的日益普及和多种DAA-C方法的可用性要求进行全面评估,为最终用户和工具开发人员提供建议和指导。与针对独立微生物组数据的 DAA方法的几项基准研究相比,还没有针对相关微生物组数据的DAA-C方法进行基准研究。因此,在这项研究中,研究团队进行了一项大规模模拟研究,以客观地评估现有主要DAA-C方法在各种设置下的性能。
DAA-C方法基准测试
研究团队使用半参数模拟框架对主要现有DAA-C方法的性能进行了基准测试,该框架能够生成具有特定相关性结构的真实微生物组数据。此项研究在三种常见的研究设计下评估DAA-C方法的性能,这些设计包括(i)重复采样,其中每个微生物组样本都要进行多次测量,以减少噪声;(ii)配对设计,在每个受试者治疗前后对微生物组进行采样;(iii)一般纵向采样,即在多个时间点对两组受试者的微生物群落进行采样。研究团队还重点评估DAA-C方法控制误报的能力以及在错误发现率(FDR)控制之后检测真实关联信号的能力。
本研究评价的DAA-C方法
研究结论:
线性模型方法(如LinDA、MaAsLin2和LDM)比基于广义线性模型的方法性能相对更稳健;没有一种评估方法在各种设置中是最佳的,性能最佳的方法主要取决于生物学真相和数据特征;LinDA方法在假阳性控制和功率间有较好的权衡,且是唯一在强成分效应下能有效控制FDR的方法。
DAA-C方法在大便和阴道微生物组数据全局空值设置下的性能(重复采样)
重复采样设计下的假阳性对照和功率(平衡变化设置,A:粪便,B:阴道)
配对采样设计下的假阳性对照和功率(平衡变化设置,A:粪便,B:阴道)
一般纵向设计下的假阳性控制和功率下(平衡变化设置)。A,B:测试组(X)效应[A:粪便,B:阴道]和C,D:测试时间(T)效应[C:粪便,D:阴道]
配对采样设计下的假阳性对照和功率(不平衡变化设置,A:粪便,B:阴道)
一般纵向设计下的假阳性控制和功率下(不平衡变化设置)。A,B:测试组(X)效应[A:粪便,B:阴道]和C,D:测试时间(T)效应[C:粪便,D:阴道]
基于各种评估指标的DAA-C方法的性能总结
基于三个实验数据集的纵向差异丰度分析(DAA-c)方法评估
//
建议对细节感兴趣的小伙伴参考文献原文~文章无法覆盖所有工具,欢迎大家在讨论区留言分享好用的工具资源。对于文献整理过程中有翻译不当或错误也欢迎大家在评论区留言指出,互相交流学习!
参考文献
Yang L, Chen J. Benchmarking differential abundance analysis methods for correlated microbiome sequencing data[J]. Briefings in Bioinformatics, 2023, 24(1): bbac607.