news 2026/2/18 18:46:38

如何进行群体遗传结构分析?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何进行群体遗传结构分析?

群体遗传结构,作为群体遗传学的核心研究目标与关键产出,旨在揭示遗传变异在群体中的时空分布格局。在众多相关研究中,由系统发育树、主成分分析与ADMIXTURE等经典方法共同构成的整合分析图谱,已成为解码这一格局的“标准密码”(图1)。今天,我们将共同学习如何从重测序数据出发,一步步完成这份核心图谱的构建。

图1 群体遗传结构示例

图a系统发育树,观察各枝分布来判断群体的聚类情况。图b主成分分析,不同的颜色代表了不同的群体,观察不同颜色样本在坐标图中的位置来判断群体演化特征。图c交叉验证误差统计图,折线图最低点对应的X轴为最佳分群数。图d群体分层分析,不同颜色代表不同假设祖先群体,观察k为最佳分群数时的祖先来源构成,来推断样本的混杂或分化历史。

01 系统发育树

首先,我们通过系统发育分析来解析样本间的聚类情况。整个流程从遗传距离计算开始:我们使用VCF2Dis软件(https://github.com/BGI-shenzhen/VCF2Dis),它能基于包含样本数据的VCF文件,计算出标准化的群体间遗传距离矩阵(图2)。获得遗传距离矩阵后,可将其上传至在线工具FastME 2.0(http://www.atgc-montpellier.fr/fastme/),选择“Distance matrix”格式并设置相应参数,提交任务后即可通过邮件获取系统发育树文件(.nwk格式)。最后,将该文件导入iTOL在线平台(https://itol.embl.de/upload.cgi),即可对系统发育树进行查看、编辑与美化,从而直观展示群体间的遗传结构与聚类情况。

图2 VCF2Dis软件使用

02.主成分分析

虽然我们通过系统发育分析可以知道群体中的分群情况,但是系统发育分析却不能反映个体在宏观遗传空间中的位置。这个时候我们就需要利用主成分分析找出能最大程度解释遗传变异的前几个主成分,并将每个样本投射到这个由PC构成的二维/三维“地图”上。通过主成分分析可以知道群体主要的分化方向,是连续渐变还是离散聚类以及找群体中的离散个体(图3)。这个过程我们使用Plink计算主成分,使用R语言(https://posit.co/download/rstudio-desktop/)进行可视化绘图。

图3 主成分计算

图4 R语言绘图

03.群体分层分析

通过主成分分析与系统发育分析,我们已初步揭示了样本间的聚类关系与遗传分化格局。然而,这些方法尚不能回答一个更为本质的问题:这些个体究竟源自多少个潜在的祖先群体?为了追溯群体的混合历史并量化个体的祖先来源构成,我们需要借助群体分层分析。以ADMIXTURE为代表的方法,能够推断每个个体基因组中来源于K个假设祖先群体的比例,并通过交叉验证确定最优的K值。该分析对于发现隐蔽的遗传亚群、识别混合或异常个体具有关键作用。

图5 群体遗传分层分析

图6 admixture的结果文件

通过对系统发育、主成分与群体分层分析的综合解析,我们已对群体的遗传结构有了基本的认知。然而,这些初步结果尚未充分揭示群体内各组分之间的遗传差异程度、分化水平及其内在联系。因此,为深入理解群体结构与演化动态,后续有必要开展更为精细的遗传分析,如:群体遗传分化指数分析,遗传多样性分析以及基因流分析等等。这些分析将帮助我们更完整地刻画群体的遗传格局与演化历程。后续内容我们下次再一起学习。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/13 18:42:53

使用Sambert-HifiGan前后对比:语音质量提升如此明显

使用Sambert-HifiGan前后对比:语音质量提升如此明显 引言:中文多情感语音合成的演进需求 在智能客服、有声阅读、虚拟主播等应用场景中,自然流畅且富有情感的中文语音合成(TTS) 已成为用户体验的核心要素。传统TTS系…

作者头像 李华
网站建设 2026/2/13 19:38:01

Sambert-HifiGan vs Tacotron2:中文语音合成效果全面对比

Sambert-HifiGan vs Tacotron2:中文语音合成效果全面对比 📊 选型背景:为何对比 Sambert-HifiGan 与 Tacotron2? 随着智能客服、有声阅读、虚拟主播等应用场景的爆发式增长,高质量的中文语音合成(TTS&…

作者头像 李华
网站建设 2026/2/12 18:42:20

Sambert-HifiGan在在线会议中的应用:实时语音转写

Sambert-HifiGan在在线会议中的应用:实时语音转写 引言:中文多情感语音合成的技术演进与场景需求 随着远程办公和在线协作的普及,在线会议已成为企业沟通的核心方式。然而,语言障碍、听力不便、信息回溯困难等问题依然存在。一个…

作者头像 李华
网站建设 2026/2/13 22:10:34

JAVA分块上传插件加密传输技术交流

大文件传输解决方案技术提案 项目背景与需求分析 作为山东某软件公司项目负责人,我公司需要为大文件传输提供一套完整的解决方案。经过详细的需求梳理,总结出以下几个关键需求点: 大文件传输能力:支持单文件100GB左右的上传下载…

作者头像 李华
网站建设 2026/2/13 22:10:23

768p与1024p输出质量对比:值得增加显存消耗吗?

768p与1024p输出质量对比:值得增加显存消耗吗? 引言:高分辨率视频生成的权衡挑战 随着AI驱动的图像转视频(Image-to-Video)技术快速发展,用户对生成内容的质量要求日益提升。在基于I2VGen-XL模型的Image-to…

作者头像 李华