青岛能源所发布RamEx赋能大规模拉曼组数据质检和解析
随着拉曼流式细胞仪等新装备的出现,拉曼组数据规模正在爆发性增长。如何从这些海量单细胞拉曼光谱中高效、可靠地提取可解释的生物学信息,已成为制约拉曼组广泛应用的重要瓶颈。针对这一行业痛点,青岛能源所单细胞中心开发了面向拉曼组大数据的集成分析框架RamEx。该平台针对拉曼组数据的特点,以自动化质控算法与高效并行计算流程为核心,建立了从数据读取、标准化预处理到下游数据挖掘的一站式工作流,并示范了在单细胞水平上对微生物代谢表型组异质性与代谢模式分化的系统解析。

拉曼组是一种免荧光标记、无损、信息丰富的单细胞代谢表型组,可在单细胞尺度以低成本、快速、活体的方式识别和分选从微生物到动植物等各种细胞类型的代谢状态与功能互作,因此作为一种新型的活体单细胞表型组学大数据类型,拉曼组具有极其广泛的应用价值。现有分析方法通常仅限于初步的光谱预处理,或直接将基因组学的建模与挖掘策略迁移到拉曼组数据中,难以充分适配拉曼组数据独特的信号结构、噪声模式与生物学意义。
围绕这些瓶颈问题,单细胞中心孙鲁阳研究员带领的研究小组创新性地提出了基于迭代卷积的离群值检测算法(ICOD)。该方法面向复杂微生物样本中噪声来源多样、伪影干扰强、阈值难以经验设定等现实问题,可在无预设参数的情况下动态识别异常光谱,减少对先验参数与人工阈值的依赖。该算法在病原菌、益生菌及环境微生物等多类真实样本中展现出良好的鲁棒性,为后续基于拉曼组数据的深度学习建模与机制解析提供了准确、可靠的数据基础。
基于RamEx,研究小组进一步展示了拉曼组数据在捕捉表型异质性方面的独特优势。拉曼组深度解析能追踪不同细胞中脂质、蛋白质与核酸等大分子组成的动态变化,进而在群体尺度上以单细胞精度揭示微生物代谢状态的分化与演替规律,为理解复杂群落的功能组织与环境适应机制提供了新的研究思路和技术路径。
基于拉曼组平台,单细胞原位代谢图谱科学计划(iMAPS)正在全球建设70余个微生物组代谢功能探测节点,以规模化、系统性地产出海量的拉曼组/元拉曼组大数据和原位功能菌种库。RamEx将大幅加速这些拉曼组数据的标准化质检与高通量解析,从而推动微生物组资源在全球范围内的共享共用。
相关成果发表于国际学术期刊Microbiome,单细胞中心博士生张艳美和助理研究员荆功超为论文第一作者,孙鲁阳研究员和徐健研究员为通讯作者。本研究获得国家自然科学基金、国家重点研发计划及山东省重点研发计划等项目资助。(文/张艳美 图/刘阳)
软件开源链接: https://github.com/qibebt-bioinfo/RamEx
原文链接:https://doi.org/10.1186/s40168-026-02339-3
Yanmei Zhang#, Gongchao Jing#, Rongze Chen, Yanhai Gong, Yuandong Li, Yongshun Wang, Xixian Wang, Jia Zhang, Yuli Mao, Yuehui He, Xiaoshan Zheng, Mingchao Wang, Hao Yuan, Jian Xu* & Luyang Sun*. RamEx: an R package for high-throughput microbial ramanome analyses with accurate quality assessment. Microbiome, 2026.
附件下载: