生信老学长
虚拟细胞最近很火,很多老师在后台问我虚拟细胞是什么,方案设计好了也不是很明白。因此决定写一篇推文,和老师们探讨一下虚拟细胞的技术。
目前虚拟细胞仍然处在较为浅显的状态,说是虚拟细胞,不如说是通过虚拟扰动的方法通过单细胞数据模拟基因变化的计算方法。比如单基因扰动或者多基因变化导致的网络变化从而导致其他基因权重变化。下面以Squidiff软件为例,我们看看虚拟扰动能做什么。
一、扰动原理
简单来说模型首先用编码器提取细胞身份特征(如类型、处理、发育阶段)生成z_sem。然后采用条件去噪扩散过程:训练时学习在z_sem指导下从噪声数据重建原始转录组;预测时从纯高斯噪声出发,结合目标z_sem通过迭代去噪生成全新的虚拟细胞表达谱。之后通过代数操作z_sem向量(如线性插值、向量加法),模型可预测细胞分化轨迹、基因扰动组合效应及跨细胞类型的药物反应。这种机制将复杂的生物状态变化转化为潜空间中的几何运算,使扩散模型能够生成高保真、连续变化的单细胞转录组数据。
预测细胞分化轨迹
仅使用第0天(iPSC)和第3天(内皮细胞)的数据,预测中间第1、2天的细胞状态。和关键基因。
预测非加性基因扰动(双基因敲除)
预测同时敲除ZBTB25和PTPN12两个基因在K562细胞中的联合效应。
- 跨细胞类型药物反应预测(胶质母细胞瘤)
细胞 + 药物 预测细胞类型及效应强度
- 模拟血管类器官发育与辐射损伤
通过预测具有真实时间梯度信息的细胞,发现发育过程
- 预测未见过的药物效应
其他软件,例如UNAGI虽然原理不同,但是基本思路是类似的。
更多热门科研方案,找生信老学长。