摘要
DisProt是整合内在无序蛋白(IDP)、内在无序区域(IDR)及其功能相关实验证据的开源数据库。过去2年间,数据库规模增长超20%,目前收录3,201种IDP、13,347条证据,其中新增超1,500条结构状态注释与1,300余条功能注释。数据库全面推行「无序实验最小信息规范」(MIADE),携带完整实验细节的注释数量实现翻倍以上,显著提升了无序相关实验结果的可解读性。网站已升级为知识库与数据提交系统一体化的混合平台,新增专属提交页面,支持外部用户直接提交数据。依托MobiDB中基于BLAST的同源注释传递机制,DisProt的无序区域与线性互作肽注释已从数百种蛋白拓展至覆盖11,000余种生物的数10万种蛋白。本次新版本实现研究范式升级:首次将经人工核验的计算预测结果纳入有效证据范畴,同时对内在无序蛋白本体(IDPO)进行重大更新与结构重构,全面提升了注释准确性、跨系统互操作性与语义清晰度。DisProt持续通过培训资源与AI文献筛选工具DisTriage支撑社区协作,为审编人员提供定期更新的高优先级文献清单。
https://disprot.org/
silvio.tosatto@unipd.it
mariacristina.aspromonte@unipd.it
#内在无序蛋白 #内在无序区域 #开源数据库 #蛋白注释 #MIADE规范 #同源注释传递 #蛋白本体 #智能文献筛选
DisProt 2026版:进展与新功能
新功能:DisProt文献提交页面
图1文献提交流程关键步骤示意图
使用BioRender绘制。
来源:Aspromonte, M. (2025) https://BioRender.com/z5rq1gc
蛋白覆盖度、重注释与功能富集
表1DisProt各本体主要分支的功能与结构注释统计
表中展示DisProt 9.8版本中,IDPO各维度(结构状态、结构转变、无序功能)与基因本体(GO)各领域(分子功能、生物过程、细胞组分)对应的蛋白总数与注释总数。
图22023年与2025年不同维度注释数量对比
对比维度包括结构状态、结构转变与功能。功能类别汇总了所有无序相关功能注释,整合了IDPO无序功能术语与GO的分子功能、生物过程、细胞组分注释。柱旁百分比表示该类别注释较2023年的相对增幅。
图3DisProt中使用频次最高的15个GO与IDPO功能术语分布
同时展示了每个术语对应的注释蛋白数量,以及各功能类别下的术语多样性。存在多条相同注释的蛋白(如不同文献报道同1实验证据)仅统计1次。
无膜细胞器(nmbo);解旋酶-拓扑异构酶(ht)。
MIADE术语深度整合,提升实验注释精度
图4DisProt注释中MIADE信息覆盖概况
展示MIADE信息在不同注释类型与实验细节中的分布。
(A) 韦恩图展示DisProt 9.8版注释中3类MIADE信息的包含重叠情况。
(B) 按注释类型划分的MIADE描述符占比:结构转变类注释的实验细节密度最高(27.5%),其次为功能注释(17%)与结构状态注释(16.8%)。
跨生命演化树的注释整合
图5DisProt注释蛋白的分类学分布
(A) 生命4大域的注释蛋白数量。
(B) 不同真核生物类群的注释蛋白数量。
表2各专题数据集收录的IDP与IDR数量统计
各数据集中,GO与IDPO注释按注释区域层级统计;无序含量按蛋白层级计算,为对应专题数据集内所有蛋白无序占比的平均值。
DisTriage:无查询依赖的文献筛选工具,支撑数据库AI化建设
表3DisTriage在排名前10、前20、前50文献中的真阳性数与精准度
详细总结
思维导图
参考
Nucleic Acids Res. 2026 Jan 6;54(D1):D383-D392. doi: 10.1093/nar/gkaf1175.
DisProt in 2026: enhancing intrinsically disordered proteins accessibility, deposition, and annotation
注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。