news 2026/2/22 6:32:16

<span class=“js_title_inner“>NC | TidyMass2解决代谢物溯源与功能模块分析难题</span>

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
<span class=“js_title_inner“>NC | TidyMass2解决代谢物溯源与功能模块分析难题</span>

引言:代谢组学分析的“最后一公里”

非靶向代谢组学(Untargeted Metabolomics)作为探索生命活动最直接的手段,已广泛应用于疾病机制、环境暴露和微生物互作研究。然而,在海量数据的背后,研究人员往往面临着难以跨越的“鸿沟”:

  1. 来源不明: 检测到的代谢物究竟是来自宿主本身、肠道菌群、饮食摄入还是环境暴露?缺乏系统的溯源工具。

  2. 注释率低: 仅依靠二级质谱(MS2)匹配,往往只有10%-20%的代谢特征能被注释,大量潜在的生物学信息(“暗物质”)被遗漏。

  3. 门槛过高: 复杂的数据处理流程通常需要编程基础,限制了临床医生和生物学家的使用。

针对这些痛点,新加坡南洋理工大学申小涛教授团队联合河南大学、哈佛大学、浙江大学、耶鲁大学、香港浸会大学等多家机构,在Nature Communications上发表了题为“TidyMass2: advancing LC-MS untargeted metabolomics through metabolite origin inference and metabolic feature-based functional module analysis”的研究论文。

该研究推出了TidyMass2,一个功能全面升级的计算框架,不仅引入了代谢物来源推断和基于特征的功能模块分析,更提供了用户友好的无代码的图形化界面(Shiny App),极大的降低了非靶代谢组学数据分析门槛。

王骁博士(河南大学博士后),刘亦江(新加坡南洋理工大学在读博士生)为共同第一作者。申小涛博士(南洋理工大学助理教授),高鹏博士(哈佛大学助理教授),张学斌博士(河南大学教授)为共同通讯作者。

研究亮点: 非靶代谢组学研究新范式

全面进化,从代码到“所见即所得”

TidyMass2 在前作 TidyMass 的基础上进行了彻底的革新。它不仅是一个R语言包,更是一个完整的生态系统。为了简化软件安装复杂依赖问题,团队提供了 Docker 镜像供用户使用,为了打破编程壁垒,团队开发了TidyMassShiny,这是一个基于 Web 的图形用户友好型界面。

TidyMass2 引入了 massDatabase 包管理数据库,metID 新增溯源功能,metPath 增强了功能模块分析; TidyMassShiny 提供了跨平台(Windows/macOS/Linux)和云端部署的无代码分析体验。

核心优势:

• 无代码操作: 通过直观的界面即可完成从数据清洗、质控到注释、通路分析的全流程。

• 多端适配: 支持个人电脑 Docker 部署,也支持实验室服务器或云端部署。

• 数据管理: 新增 massDatabase 包,轻松管理在线和本地的化合物及通路数据库。

此外,为了方便无计算资源的用户使用,研究团队部署了TidyMassShiny的在线分析平台https://tidymassshiny.jaspershenlab.com

MetOriginDB——精准追踪代谢物的“前世今生”

为了解决“代谢物从哪里来”的问题,研究团队整合了 HMDB、KEGG、MiMeDB、FooDB、T3DB 等 11 个主流数据库,构建了目前已知最全面的带有来源信息的代谢物数据库,MetOriginDB。

该数据库涵盖了超过 53 万个带有来源信息的代谢物,分为人类、细菌、植物、食物、药物、环境和动物七大类,并与二级质谱数据库实现了无缝整合。

主要突破:

• 海量覆盖: 包含 532,488 个带有来源信息的代谢物。

• 多维分类: 将代谢物来源精准划分为人类(宿主)、微生物、饮食、药物、环境等7大类。

• 精准溯源: 能够区分宿主内源性代谢物与菌群共代谢物,甚至能识别具体的环境污染物(如农药残留)。

功能模块分析:点亮代谢组学的“暗物质”

传统分析往往受限于极低的代谢物注释率(~10%),导致大量显著差异的代谢特征无法被解释。TidyMass2提出了基于代谢特征的功能模块分析(Metabolic Feature-based Functional Module Analysis, FFMA)。

首先,我们构建了包含 9,630 个代谢物和 30,196 个反应的综合代谢网络,利用网络拓扑结构,将未完全注释的代谢特征聚类成功能模块,大幅提升生物学解释度。 技术创新:

• 网络挖掘: 利用包含 9,630 个节点和 30,196 条边的超大人类代谢网络,通过随机游走算法识别代谢模块。

• 变废为宝: 即使没有二级质谱确证,也能通过网络邻接关系推断未注释特征的功能。

• 显著提升: 在妊娠尿液代谢组学案例中,该方法将可解释的代谢特征比例从 5.8% 提升至 58.8%,富集的通路从 1 个增加到 29 个。

应用案例:妊娠期尿液代谢组学的深度解析

研究团队利用 TidyMass2 对 36 名孕妇的纵向尿液样本进行了重新分析,展示了该工具在代谢溯源及代谢网络解析中的强大功能。

环境暴露与菌群变化:

借助 MetOriginDB,研究成功识别出孕晚期显著升高的环境污染物(如吡虫啉 Imidacloprid)和菌群代谢物(如 N-乙酰甘露糖胺),揭示了妊娠期独特的暴露组学特征。

揭示系统性代谢重编程:

利用功能模块分析,研究识别了 27 个失调的代谢模块,不仅重现了经典的类固醇激素生物合成通路,还新发现了与妊娠期糖尿病风险相关的碳水化合物代谢异常以及咖啡因代谢的显著变化。


总结与展望

TidyMass2 通过整合 MetOriginDB 溯源系统和 FFMA 功能模块分析,为非靶向代谢组学提供了一套从数据处理到深度生物学解读的完整解决方案。特别是 Shiny App 的推出,体现了团队致力于开源科学(Open Science)和降低分析门槛的决心。

无论是探索宿主-微生物互作,还是进行环境暴露组学研究,TidyMass2 都将成为您手中强有力的分析利器。

资源获取

• 论文链接: https://doi.org/10.1038/s41467-026-68464-7

• 项目主页 & 数据库下载: https://www.tidymass.org/

• 代码开源(GitHub): https://github.com/tidymass

• 在线 Shiny App: https://tidymassshiny.jaspershenlab.com

作者简介

  • 王骁博士

王骁博士毕业于中国农业科学院棉花研究所,现任河南大学作物逆境适应与改良国家重点实验室(张学斌教授课题组)博士后,同时担任 Tidymass 项目开发组成员。主要致力于植物次生代谢对生长发育及环境适应的调控机制研究,并从事代谢组学数据分析方法的开发工作。相关学术成果已发表于 Nature Communications、The Plant Cell、Molecular Plant 以及 Journal of Integrative Plant Biology 等国际权威期刊。

  • 刘亦江

现为新加坡南洋理工大学在读博士生,Shen Lab成员。主要研究兴趣聚焦于代谢组学与衰老机制,是 TidyMass 项目的活跃贡献者,希望通过开发高效的计算工具来解决实际的生物医学问题。

  • 申小涛教授

申小涛博士是新加坡南洋理工大学李光前医学院的助理教授。主要研究方向为(1)多组学数据分析方法开发(尤其是菌群和代谢的相互作用),(2)质谱数据分析方法开发,(3)多组学和精准医学(衰老和母婴健康)。

  • 张学斌教授

现为河南大学生命科学学院教授,博士生导师。团队的研究主要聚焦于植物酚类化合物合成与代谢及多组学联合解析其在植物逆境适应中的分子机理。课题组长期致力于建立完善的作物多组学研究体系,组建了《河南大学多组学联合研究中心》、《河南省作物逆境多组学国际联合实验室》,目前已经建立了包括:非标记定量蛋白质组学,标记定量蛋白质组学,修饰蛋白质组学,非靶向代谢组学、拟靶向代谢组学、靶向代谢组学、激素组学、脂质组学、完整细胞壁成分鉴定体系等组学方法体系。欢迎对多组学技术感兴趣的老师、同学交流、合作。课题组常年招收博士后和硕博士研究生,欢迎对多组学尤其是代谢组学方向感兴趣的同学加入。

  • 高鹏教授

高鹏教授是哈佛大学陈曾熙公共卫生学院环境健康与暴露组学领域的助理教授,专注于暴露组学和环境健康研究。研究方向主要为:(1)暴露组学与慢性疾病关联:通过整合多组学数据,分析环境暴露(如化学物质、污染物)与慢性疾病(如神经退行性疾病、呼吸系统疾病)的因果关系。(2)精准环境健康评估:开发新型分析化学和生物信息学方法,实现个性化暴露评估,为环境健康政策提供科学依据。(3)纵向暴露组研究:探索环境暴露在人类全生命周期中的动态影响,尤其关注早期暴露对成年疾病的风险预测。

参考文献

[1] Wang, X., Liu, Y., Jiang, C. et al. TidyMass2: advancing LC-MS untargeted metabolomics through metabolite origin inference and metabolic feature-based functional module analysis. Nat Commun (2026).



编辑:Xiao Wang and Yijiang Liu

审核:Jasper Shen

多组学与健康公众号由新加坡南洋理工大学Shen lab运行.

如果有任何问题,请直接给公众号留言,或者发邮件(shenxt1990@outlook.com)。

所有文章都同步在实验室的网站上,https://www.shen-lab.org/。

宏基因组推荐


  • 9月12-14日,高级转录组分析和R语言数据可视化

  • 10月18-19日,微生物组-扩增子16S分析

  • 11月15-16日,微生物组-宏基因组分析

本公众号现全面开放投稿,希望文章作者讲出自己的科研故事,分享论文的精华与亮点。投稿请联系小编(微信号:yongxinliu 或 meta-genomics)

iMeta高引 fastp PhyloSuite ImageGP2 iNAP2 ggClusterNet2
iMeta工具 SangerBox2 美吉2024 OmicStudio Wekemo OmicShare
iMeta综述 高脂饮食菌群 发酵中药 口腔菌群 微塑料 癌症 宿主代谢

10000+:扩增子EasyAmplicon 比较基因组JCVI 序列分析SeqKit2 维恩图EVenn

iMetaOmics高引 猪微生物组 16S扩增子综述 易扩增子(EasyAmplicon)

系列教程:微生物组入门 Biostar 微生物组 宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

点击阅读原文

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/16 5:42:37

分布式系统安全通信

1、非修改序列算法 这些算法不会改变它们所操作的容器中的元素。 1.1 find 和 find_if find(begin, end, value):查找第一个等于 value 的元素,返回迭代器(未找到返回 end)。find_if(begin, end, predicate):查找第…

作者头像 李华
网站建设 2026/2/12 7:44:56

BigemapPro专题制图 | 三步完成城市土地利用类型图

GIS专题图——城市土地利用类型图制作教程,按以下流程操作,即可高效生成符合规范的城市土地利用类型专题图。 一、数据准备 准备矢量数据:需使用shp格式的城市用地分类数据 建议先行裁剪:原始数据体量较大时,右键点击…

作者头像 李华
网站建设 2026/2/21 18:53:05

2026年AI开发平台的终极竞争——生态与开发者心智

当技术功能逐渐同质化,2026年AI开发平台的竞争将上升到生态与开发者体验的维度。谁能为开发者创造最大价值,谁能构建最繁荣的应用生态,谁就将赢得未来。这对企业意味着,在思考AI开发平台怎么选时,必须评估其“生态健康…

作者头像 李华
网站建设 2026/2/15 12:54:31

让“入职背调”成为您人才决策的坚实基石

在竞争激烈的人才市场,一次误聘不仅带来高昂成本,更可能影响团队稳定与企业声誉。传统的背景调查方式耗时长、信息零散、核实困难,让招聘工作充满不确定性。 江湖背调,为您提供高效、可靠、合规的一站式解决方案。系统深度对接权威…

作者头像 李华
网站建设 2026/2/11 9:03:24

MDN全面接入Deno兼容性数据:现代Web开发的“一张图”方案

从“双轨”到“一图”:Deno兼容性数据正式落地MDN Deno官方博客的一则简短公告,却让前端开发者群体瞬间沸腾——Deno的兼容性数据现在与MDN Web API图表同框显示。这意味着,过去需要分别查看Node.js、Chrome、Firefox以及Deno四条兼容曲线的…

作者头像 李华