青岛能源所微生物组大数据分析工具开发取得新进展
元基因组是当前微生物组大数据最主要的存在形式之一。由于元基因组数据的复杂性、异质性以及指数级增长的体量,从中深度且快速发掘微生物群落结构和功能上的变化规律,一直是业界的一个重要技术瓶颈。近日,青岛能源所单细胞研究中心发表了元基因组高性能计算分析软件Parallel-META 3,能够深入、全面、快速地将数量庞大的未知微生物组进行结构与功能解析,从而剖析疾病或生态灾害下微生物组的变化规律(图1)。
微生物组(又称“菌群”)在地球生态圈中无所不在,而一个微生物组元基因组的数据量可以是一个人类基因组的成百上千倍。因此,针对海量元基因组数据的深度且快速解析对于微生物组研究至关重要。但是,目前国际上已有的元基因组分析软件在计算精度和运算速度上已经无法满足当前微生物组技术的发展需求,而且其繁琐的安装和操作步骤也给国内外广大用户带来了困扰。因此,Parallel-META 3应运而生,其16S rRNA/18S rRNA片段提取、拷贝数修正、功能基因预测、多样性分析、生物标记筛选、共生网络分析等先进分析技术使其在准确性和全面性上具有显著优势,而且其全自动分析的设计理念大大简化了用户的安装和使用难度。与此同时,得益于全局并行化计算技术,Parallel-META 3在运算速度和数据吞吐量等性能方面有显著提高,真正实现了海量数据分析的“立等可取”。下一步Parallel-META 3将拓展到微生物基因的功能解析与进化分析,实现微生物组代谢网络的重建和比较,从而支撑微生物组大数据搜索引擎MSE(http://mse.single-cell.cn)服务业界的努力。
该研究日前发表于Scientific Reports,并获得了软件著作权(登记号:2016SR053280)。它是苏晓泉副研究员带领的单细胞中心生物信息团队完成的,获得了科技部863、国家自然科学基金、山东省自然科学基金领军人才前瞻性研究专题等的前期支持。
图1、Parallel-META 3工作流程
文章链接:Jing, et al., Parallel-META 3: Comprehensive taxonomical and functional analysis platform for efficient comparison of microbial communities, Scientific Reports, 7:40371, DOI:10.1038/srep40371, http://www.nature.com/articles/srep40371
软件下载:http://bioinfo.single-cell.cn/parallel-meta.html
附件下载: