青岛能源所推出第二代微生物组搜索引擎MSE 2
微生物组(即“菌群”)是微生物在自然界的存在形式,它们在自然界中无处不在,而且塑造了人类社会的过去、现在和未来。因此,微生物组“大数据”的深度挖掘,是利用菌群实现精准诊断、精准护理与精准营养的重要工具,也是认识生物资源、监控环境健康、维护国家生物安全的新手段。近日,青岛能源所单细胞中心发布了第二代微生物组搜索引擎MSE 2(http://mse.ac.cn),以支撑更全面、更深入、更便捷的菌群大数据挖掘。该项工作于1月20日发表于mSystems(美国微生物学会会刊)。
在海量的人类已知微生物组数据空间中,微生物组搜索引擎(MSE)针对新的菌群样本,以亚秒级别的反应时间寻找结构类似样本,从而全面、快速地挖掘新样本的特征。因此,MSE被誉为“the Google of Microbiome”,并入选“2016年中国医药生物技术十大进展”。MSE 2从参照数据库、搜索引擎内核和用户界面等三个方面做了全面升级(图1)。具体来说,首先,相对于包含10万例16S rRNA扩增子测序样本的第一代MSE数据库,MSE 2中搜集、标准化分析和可视化了涵盖16S rRNA扩增子和鸟枪法元基因组类型的近27万个样本,是国内外生态系统覆盖最全面、样本数量最丰富的标准化元基因组数据库之一。其次,MSE 2的搜索引擎内核已完全兼容16S rRNA和鸟枪法两种测序数据,可从OTU(Operational Taxonomy Unit)、物种名称以及功能特征等三个角度进行大规模的菌群搜索和深度分析。这一能力对于多来源、多类型、兼容各种测序策略与技术的菌群数据融合具有重要意义。
利用MSE,科研人员揭示了人类已知菌群在结构空间上的全局特征,并预测了微生物组领域最有科学潜力的方向(Su et al., mBio 2018)。同时,MSE代表着一种依托菌群大数据的疾病检测新策略,在基于肠道菌群的一些慢病诊断上,它在回答“是否健康”和“哪种疾病”这两个问题上的准确率上均优于常用的机器学习算法,从而有效降低了“漏诊”和“误诊”几率(Su et al., mSystems 2020)。此外,由于其涵盖了全面、多维、海量的微生物组及其生境信息,MSE已成为评估微生态健康、评价微生态产品疗效的有力工具,正在支撑宝洁公司等合作企业开发针对口腔、皮肤、室内环境、空气等微生态系统的精准护理和高效修复手段。基于其不断拓展的应用,MSE 2将成为遨游微生物组数据空间的“罗盘”,推动“数据驱动型”的微生态研究和大健康产业应用。
该研究由青岛能源所与青岛大学、中科院文献情报中心、中国海洋大学等科研机构合作完成。单细胞中心生物信息研究组荆功超助理研究员和刘璐助理研究员为论文的共同一作,苏晓泉教授与徐健研究员为共同通讯作者。该项目获得了国家自然科学基金、山东省自然科学基金的支持。(文/图 荆功超)
图1 第二代微生物组大数据搜索引擎MSE 2的整体框架
原文链接:
Gongchao Jing#, Lu Liu#, Zengbin Wang, Yufeng Zhang, Qian Li, Chunxiao Gao, Meng Zhang, Min Li, Zhenkun Zhang, Xiaohan Liu, Jian Xu*, Xiaoquan Su*. Microbiome Search Engine 2: a platform for taxonomic and functional search of global microbiomes on the whole-microbiome level. mSystems 2021, 6(1):e00943-20. https://doi.org/10.1128/mSystems.00943-20
Xiaogquan Su*, Gongchao Jing, Daniel McDonald, Honglei Wang, Zenbin Wang, Antonio Gonzalez, Zheng Sun, Shi Huang, Jose Navas, Rob Knight*, Jian Xu*. Identifying and predicting novelty in microbiome studies. mBio 2018, 9(6):e02099-18. https://doi.org/10.1128/mBio.02099-18
Xiaoquan Su*, Gongchao Jing, Zheng Sun, Lu Liu, Zhenjiang Xu, Daniel McDonald, Zengbin Wang, Honglei Wang, Antonio Gonzalez, Yufeng Zhang, Shi Huang, Gavin Huttley, Rob Knight*, Jian Xu*. Multiple-Disease Detection and Classification across Cohorts via Microbiome Search. mSystems 2020, 5:e00150-20. https://doi.org/10.1128/mSystems.00150-20
附件下载: