加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研动态 > 科研进展

科研人员构建消化系统细胞标志物数据库

发布时间:2025-09-26 【字体: 】【打印】 【关闭

近日,国际学术期刊Genomics, Proteomics & Bioinformatics在线发表了中国科学院上海营养与健康研究所生物医学大数据中心张国庆研究员团队的最新研究成果,题为“PreDigs: A Database of Context-specific Cell-type Markers and Precise Cell Subtypes for Digestive Cell Annotation”研究团队构建了一个面向消化系统细胞标志物研究的综合数据库PreDigs(https://www.biosino.org/predigs/),系统整合了124个精选单细胞RNA测序数据集,涵盖340万余个细胞。此外,PreDigs还提供了在线细胞注释工具,允许用户更灵活地对单细胞进行分类,并能完整支持消化系统细胞亚型鉴定、肿瘤微环境分析和细胞异质性研究等过程。

消化道癌症是全球健康的主要威胁,其肿瘤微环境(Tumor Microenvironment, TME)具有高度异质性,亟需精准的单细胞图谱进行解析。然而现有的细胞标志物数据库普遍缺乏细胞类型的标准化工序、跨组织比对功能以及针对TME复杂性的深度注释信息。PreDigs的建立有效填补了这一空白

研究团队通过整合大量scRNA-seq数据集并采用先进的注释流程,构建了包含8个层级(图1B)、142种细胞类型的本体树。同时,针对不同研究需求,团队创新性地定义了三种上下文特异性标志物:(1)“Cell Markers”——用于跨组织比较同一细胞类型;(2)“Subtype Markers”——用于揭示组织内细胞亚型差异;(3)“TPN Markers”——用于解析肿瘤组织、癌旁组织及正常组织特异性(图1A。该数据库还特别提供了三种精心设计的标志物分析模块,用于支持不同场景的研究需求(图2)。这些细胞与标志物数据主要来源于消化系统的正常、癌旁及癌变组织(图1A),为深入研究消化道癌症的TME提供了全面可靠的资源。

在此基础上,PreDigs还提供了包括细胞本体树浏览、标志物可视化比较、单细胞数据集交互探索和在线细胞注释工具在内的多种功能。通过PreDigs,用户不仅可系统查询与比较不同生理病理背景下细胞类型的标志物及其功能特征,还可浏览并下载经过统一处理的单细胞数据集。该数据库目前已支持超过140种细胞类型的精准注释,极大促进了消化道肿瘤微环境中细胞异质性的深入解析,为研究人员开展高通量单细胞数据挖掘提供了关键平台支撑。

中国科学院上海营养与健康研究所生物医学大数据中心博士后孟佳玥、工程师黄俞玮同济大学博士研究生韩梦瑶为论文共同第一作者。中国科学院上海营养与健康研究所张国庆研究员、高级工程师袁力贇为论文共同通讯作者。该研究得到了国家自然科学基金、上海市市级科技重大专项、中国科学院战略性先导科技专项(B类)、科技部国家重点研发计划等项目的支持。

文章链接:https://academic.oup.com/gpb/advance-article/doi/10.1093/gpbjnl/qzaf066/8224594



图1:PreDigs数据概况。A)PreDigs数据库包含124个经过专门处理的单细胞RNA测序数据集,涵盖142种细胞类型,总共涉及约340万个细胞,来源于5种消化器官和3种组织类型。饼图分别展示了不同消化器官(上图)及不同组织类型(下图)中数据集和单细胞的分布情况。B)细胞本体树结构示意图,共包含8个层级。该层次结构中所使用的细胞类型名称均遵循细胞本体数据库(Cell Ontology)提供的标准化命名及格式规范。


图2:PreDigs 数据库概览