引言:代谢组学分析的“最后一公里”
非靶向代谢组学(Untargeted Metabolomics)作为探索生命活动最直接的手段,已广泛应用于疾病机制、环境暴露和微生物互作研究。然而,在海量数据的背后,研究人员往往面临着难以跨越的“鸿沟”:
来源不明: 检测到的代谢物究竟是来自宿主本身、肠道菌群、饮食摄入还是环境暴露?缺乏系统的溯源工具。
注释率低: 仅依靠二级质谱(MS2)匹配,往往只有10%-20%的代谢特征能被注释,大量潜在的生物学信息(“暗物质”)被遗漏。
门槛过高: 复杂的数据处理流程通常需要编程基础,限制了临床医生和生物学家的使用。
针对这些痛点,新加坡南洋理工大学申小涛教授团队联合河南大学、哈佛大学、浙江大学、耶鲁大学、香港浸会大学等多家机构,在Nature Communications上发表了题为“TidyMass2: advancing LC-MS untargeted metabolomics through metabolite origin inference and metabolic feature-based functional module analysis”的研究论文。
该研究推出了TidyMass2,一个功能全面升级的计算框架,不仅引入了代谢物来源推断和基于特征的功能模块分析,更提供了用户友好的无代码的图形化界面(Shiny App),极大的降低了非靶代谢组学数据分析门槛。
王骁博士(河南大学博士后),刘亦江(新加坡南洋理工大学在读博士生)为共同第一作者。申小涛博士(南洋理工大学助理教授),高鹏博士(哈佛大学助理教授),张学斌博士(河南大学教授)为共同通讯作者。
研究亮点: 非靶代谢组学研究新范式
全面进化,从代码到“所见即所得”
TidyMass2 在前作 TidyMass 的基础上进行了彻底的革新。它不仅是一个R语言包,更是一个完整的生态系统。为了简化软件安装复杂依赖问题,团队提供了 Docker 镜像供用户使用,为了打破编程壁垒,团队开发了TidyMassShiny,这是一个基于 Web 的图形用户友好型界面。
TidyMass2 引入了 massDatabase 包管理数据库,metID 新增溯源功能,metPath 增强了功能模块分析; TidyMassShiny 提供了跨平台(Windows/macOS/Linux)和云端部署的无代码分析体验。
核心优势:
• 无代码操作: 通过直观的界面即可完成从数据清洗、质控到注释、通路分析的全流程。
• 多端适配: 支持个人电脑 Docker 部署,也支持实验室服务器或云端部署。
• 数据管理: 新增 massDatabase 包,轻松管理在线和本地的化合物及通路数据库。
此外,为了方便无计算资源的用户使用,研究团队部署了TidyMassShiny的在线分析平台https://tidymassshiny.jaspershenlab.com
MetOriginDB——精准追踪代谢物的“前世今生”
为了解决“代谢物从哪里来”的问题,研究团队整合了 HMDB、KEGG、MiMeDB、FooDB、T3DB 等 11 个主流数据库,构建了目前已知最全面的带有来源信息的代谢物数据库,MetOriginDB。
该数据库涵盖了超过 53 万个带有来源信息的代谢物,分为人类、细菌、植物、食物、药物、环境和动物七大类,并与二级质谱数据库实现了无缝整合。
主要突破:
• 海量覆盖: 包含 532,488 个带有来源信息的代谢物。
• 多维分类: 将代谢物来源精准划分为人类(宿主)、微生物、饮食、药物、环境等7大类。
• 精准溯源: 能够区分宿主内源性代谢物与菌群共代谢物,甚至能识别具体的环境污染物(如农药残留)。
功能模块分析:点亮代谢组学的“暗物质”
传统分析往往受限于极低的代谢物注释率(~10%),导致大量显著差异的代谢特征无法被解释。TidyMass2提出了基于代谢特征的功能模块分析(Metabolic Feature-based Functional Module Analysis, FFMA)。
首先,我们构建了包含 9,630 个代谢物和 30,196 个反应的综合代谢网络,利用网络拓扑结构,将未完全注释的代谢特征聚类成功能模块,大幅提升生物学解释度。 技术创新:
• 网络挖掘: 利用包含 9,630 个节点和 30,196 条边的超大人类代谢网络,通过随机游走算法识别代谢模块。
• 变废为宝: 即使没有二级质谱确证,也能通过网络邻接关系推断未注释特征的功能。
• 显著提升: 在妊娠尿液代谢组学案例中,该方法将可解释的代谢特征比例从 5.8% 提升至 58.8%,富集的通路从 1 个增加到 29 个。
应用案例:妊娠期尿液代谢组学的深度解析
研究团队利用 TidyMass2 对 36 名孕妇的纵向尿液样本进行了重新分析,展示了该工具在代谢溯源及代谢网络解析中的强大功能。
环境暴露与菌群变化:
借助 MetOriginDB,研究成功识别出孕晚期显著升高的环境污染物(如吡虫啉 Imidacloprid)和菌群代谢物(如 N-乙酰甘露糖胺),揭示了妊娠期独特的暴露组学特征。
揭示系统性代谢重编程:
利用功能模块分析,研究识别了 27 个失调的代谢模块,不仅重现了经典的类固醇激素生物合成通路,还新发现了与妊娠期糖尿病风险相关的碳水化合物代谢异常以及咖啡因代谢的显著变化。
总结与展望
TidyMass2 通过整合 MetOriginDB 溯源系统和 FFMA 功能模块分析,为非靶向代谢组学提供了一套从数据处理到深度生物学解读的完整解决方案。特别是 Shiny App 的推出,体现了团队致力于开源科学(Open Science)和降低分析门槛的决心。
无论是探索宿主-微生物互作,还是进行环境暴露组学研究,TidyMass2 都将成为您手中强有力的分析利器。
资源获取
• 论文链接: https://doi.org/10.1038/s41467-026-68464-7
• 项目主页 & 数据库下载: https://www.tidymass.org/
• 代码开源(GitHub): https://github.com/tidymass
• 在线 Shiny App: https://tidymassshiny.jaspershenlab.com
作者简介
王骁博士
王骁博士毕业于中国农业科学院棉花研究所,现任河南大学作物逆境适应与改良国家重点实验室(张学斌教授课题组)博士后,同时担任 Tidymass 项目开发组成员。主要致力于植物次生代谢对生长发育及环境适应的调控机制研究,并从事代谢组学数据分析方法的开发工作。相关学术成果已发表于 Nature Communications、The Plant Cell、Molecular Plant 以及 Journal of Integrative Plant Biology 等国际权威期刊。
刘亦江
现为新加坡南洋理工大学在读博士生,Shen Lab成员。主要研究兴趣聚焦于代谢组学与衰老机制,是 TidyMass 项目的活跃贡献者,希望通过开发高效的计算工具来解决实际的生物医学问题。
申小涛教授
申小涛博士是新加坡南洋理工大学李光前医学院的助理教授。主要研究方向为(1)多组学数据分析方法开发(尤其是菌群和代谢的相互作用),(2)质谱数据分析方法开发,(3)多组学和精准医学(衰老和母婴健康)。
张学斌教授
现为河南大学生命科学学院教授,博士生导师。团队的研究主要聚焦于植物酚类化合物合成与代谢及多组学联合解析其在植物逆境适应中的分子机理。课题组长期致力于建立完善的作物多组学研究体系,组建了《河南大学多组学联合研究中心》、《河南省作物逆境多组学国际联合实验室》,目前已经建立了包括:非标记定量蛋白质组学,标记定量蛋白质组学,修饰蛋白质组学,非靶向代谢组学、拟靶向代谢组学、靶向代谢组学、激素组学、脂质组学、完整细胞壁成分鉴定体系等组学方法体系。欢迎对多组学技术感兴趣的老师、同学交流、合作。课题组常年招收博士后和硕博士研究生,欢迎对多组学尤其是代谢组学方向感兴趣的同学加入。
高鹏教授
高鹏教授是哈佛大学陈曾熙公共卫生学院环境健康与暴露组学领域的助理教授,专注于暴露组学和环境健康研究。研究方向主要为:(1)暴露组学与慢性疾病关联:通过整合多组学数据,分析环境暴露(如化学物质、污染物)与慢性疾病(如神经退行性疾病、呼吸系统疾病)的因果关系。(2)精准环境健康评估:开发新型分析化学和生物信息学方法,实现个性化暴露评估,为环境健康政策提供科学依据。(3)纵向暴露组研究:探索环境暴露在人类全生命周期中的动态影响,尤其关注早期暴露对成年疾病的风险预测。
参考文献
[1] Wang, X., Liu, Y., Jiang, C. et al. TidyMass2: advancing LC-MS untargeted metabolomics through metabolite origin inference and metabolic feature-based functional module analysis. Nat Commun (2026).
编辑:Xiao Wang and Yijiang Liu
审核:Jasper Shen
多组学与健康公众号由新加坡南洋理工大学Shen lab运行.
如果有任何问题,请直接给公众号留言,或者发邮件(shenxt1990@outlook.com)。
所有文章都同步在实验室的网站上,https://www.shen-lab.org/。
宏基因组推荐
9月12-14日,高级转录组分析和R语言数据可视化
10月18-19日,微生物组-扩增子16S分析
11月15-16日,微生物组-宏基因组分析
本公众号现全面开放投稿,希望文章作者讲出自己的科研故事,分享论文的精华与亮点。投稿请联系小编(微信号:yongxinliu 或 meta-genomics)
iMeta高引 fastp PhyloSuite ImageGP2 iNAP2 ggClusterNet2
iMeta工具 SangerBox2 美吉2024 OmicStudio Wekemo OmicShare
iMeta综述 高脂饮食菌群 发酵中药 口腔菌群 微塑料 癌症 宿主代谢
10000+:扩增子EasyAmplicon 比较基因组JCVI 序列分析SeqKit2 维恩图EVenn
iMetaOmics高引 猪微生物组 16S扩增子综述 易扩增子(EasyAmplicon)
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
点击阅读原文