你是否曾想过,除了基因序列本身,还有一层“隐藏的密码”在悄悄调控作物的性状?它就是——DNA甲基化。
近日,浙江大学研究团队在《Cell Research》发表重磅研究成果,在207份棉花种质中完成了全球首个作物单碱基分辨率群体甲基化图谱,并系统解析了甲基化变异如何独立于遗传变异调控纤维品质与产量,为作物遗传改良提供了全新视角。
样本类型:20-DPA纤维样本(207份棉花种质)
测序方法:全基因组甲基化测序、转录组测序、全基因组重测序
研究背景
▶ 棉花是全球最大的天然纺织纤维来源,同时也是研究细胞分化、伸长、细胞壁发育调控和作物多倍体化的重要模式植物。
▶ DNA甲基化是作物中重要的表观遗传调控机制,但其与遗传变异、基因表达及表型变异之间的关系尚不清楚。
▶ 本研究以207份棉花为材料,通过多组学分析揭示甲基化对纤维性状的影响,为育种提供新策略。
图 技术路线
研究结果
1.DNA 甲基化变异图谱分析
研究首先构建了庞大的表观遗传变异图谱,在207份棉花种质中,共鉴定出超过2.87亿个单甲基化多态性位点(SMPs),比SNP数量(128万个)高出约100倍,且这些 SMPs 富集于基因内部、 在转座子区域较少,提示其可能具有功能保守性。
图1 自然群体中DNA甲基化的广泛变异模式
2.甲基化与基因表达的关联分析
为解析调控机制,研究进一步定位出 542.6 万个顺式甲基化数量性状位点(cis-meQTL)、5078 个顺式表达数量性状甲基化(cis-eQTM)及 9157 个表达数量性状位点(eQTL)。其中 36.39% 的 cis-eQTM 基因独立于遗传变异,证实表观遗传可独立调控基因表达。
图2 三种DNA甲基化背景的遗传基础
图3 DNA甲基化影响的基因表达变异
3.表观遗传与纤维性状的关联分析
在农艺性状关联上,研究通过表观全基因组关联分析(EWAS)找到 1715 个与产量和纤维品质相关的表观位点,仅 2.10% 与 GWAS 位点重叠,还发现优良表观等位基因具有累加效应,结合 SMPs 与 SNPs 可提升产量和纤维品质性状的预测性能。
图4 EWAS位点分布及其对农艺性状的累积效应
研究通过整合GWAS+eQTL和EWAS+eQTM,构建了纤维性状的遗传与表观调控网络。发现 43 个可能参与纤维发育的 cis-eQTM 基因,其中 GhCIPK10 基因promoter区域的CG-SMP可显著影响其表达和纤维长度。通过CRISPR敲除验证:CIPK10突变体纤维显著变短,直接证实该基因在纤维发育中的关键作用。
图5 与纤维发育相关的遗传及表观遗传调控网络
4.开发深度学习模型DeepFDML预测功能位点
此外,基于Enformer架构开发DeepFDML模型,仅利用DNA序列即可预测功能性CG甲基化位点。最终在 ROC 曲线和 PRC 曲线上的准确率分别达 0.82 和 0.78——为缺乏甲基化数据的近缘物种提供了功能位点预测工具。
图6 用于功能性CG位点预测的网络模型
本研究首次在作物中实现了单碱基分辨率群体甲基化图谱的构建与分析,系统揭示了DNA甲基化在棉花纤维发育中的独立调控作用。它不仅提供了丰富的表观遗传资源库,也展示了表观等位基因在育种中的应用潜力。
凌恩 生物深耕农学研究,升级了多组学联合分析内容(多组学联合分析,该升级了和多组学联合分析,不能只知道KEGG,还有它们!),可提供10+种不同的联合分析思路,30+项分析结果,为客户提供更全面的分析内容。凌恩生物将为您提供“多组学数据联合”一站式分析体系,助力高效发现关键biomarker!
已有多个单一组学数据,想进行联合分析?
还未做项目,想做多组学联合分析?
参考文献
Population-wide DNA methylation polymorphisms at single-nucleotide resolution in 207 cotton accessions reveal epigenomic contributions to complex traits. Cell Research. 2024.
原文链接:
https://www.nature.com/articles/s41422-024-01027-x