生物岛实验室“新冠病毒大数据在线分析系统”上线

9月27日,“新冠病毒基因组大数据在线分析系统”攻关项目在生物岛实验室领导的大力支持下,上线运行并正式通过验收 。这是一套能够支撑重大突发性传染病病原基础研究的生物信息学和计算生物学技术中台及数据中台,为新冠病毒基础科研、防控与预警研究提供强有力的支持,填补了我国相关领域的空白 。
病毒将长期威胁人类,积极防控急需科技创新
新冠疫情爆发以来,国内疫情防控取得了举世瞩目的成效,在基础研究方面也取得了大量的科研成果 。
但是,新冠疫情防控形势仍不容掉以轻心 。一方面,各地输入性病例导致的疫情反弹时有发生;另一方面,近期有研究表明,世界上有五亿人生活在由蝙蝠带来的冠状病毒可能溢出的地区,而我国南部地区和周边国家大都位于这一区域,类似于新冠肺炎这样的新型突发性传染性疾病将会如“达摩克利斯之剑”始终高悬在人类头顶,必须时刻警惕并采取积极措施 。
有效、快速地对病毒预警预防,需要在病毒溯源、病毒基因组注释、基因组变异和疫苗的有效性分析、病毒对人类可能的长期危害研究、新的药物作用靶点发现等方面予以长期关注 。而此前国内一直缺少一个系统性的、依托前沿IT技术、能支撑包括新冠病毒在内的重大突发性传染病病原基础研究的生物信息学和计算生物学技术中台和数据中台 。
为此,生物岛实验室牵头整合中科院北京基因组研究所(国家生物信息中心)、中科院上海营养与健康研究所、中国医学科学院系统生物学研究所、中山大学、上海同济大学的科研力量,在中科院北京基因组研究所(国家生物信息中心)新冠大数据平台和中科院B类战略性先导科技专项”多维大数据驱动的中国人群精准健康“的项目支持下,协同攻关,基于实验室与“火山引擎”合作开发的生物医学大数据“操作系统”-Bio2S的开源框架体系,构建了部署在云端的“新冠病毒基因组大数据在线分析系统” 。该系统于2021年9月27日正式上线运行,除支撑本实验室的科学研究外,也为全国的科研工作者开展新冠病毒基础科研、防控与预警研究提供强有力的数据中台和技术中台,正好填补了这一空白 。
大数据分析系统将为疫情防控提供有力保障
【生物岛实验室“新冠病毒大数据在线分析系统”上线】据实验室介绍,“新冠病毒基因组大数据在线分析系统”具有统一的、一站式的方便用户访问的服务界面,其具备八大功能模块 。
一、新冠变异株检测系统-CMM-Group 。该应用模块通过合并新冠病毒基因组上共出现的核苷酸突变对,抽提出完整的共突变模块,用于表征不同基因型组别的新冠病毒,实现对新冠病毒变异体的简单直观的分类 。同时能够识别当前流行变异株以及有潜在流行能力的变异株,通过它们的时空分布揭示主要流行时间和流行区域,并提供在线分组信息、进化树和突变信息展示 。用户可通过该应用实时追踪新冠病毒的进化方向和传播路径,为新冠病毒疫情防控的快速响应提供科学依据 。
二、新冠病毒变异分析系统-VASS 。该应用模块可以在线实时分析新冠病毒基因组变异、变异注释及其可视化 。用户通过在线上传新冠病毒序列,进行变异检测与功能注释 。应用会根据序列进行变异检测,并反馈检测到的变异在所有新冠菌株中的时空信息,如变异的地理分布特征、最早出现时间等,还能在结果中提醒用户注意可能影响较大的基因组变异,如与引物/探针相关的变异或影响病毒与宿主ACE2结合亲和力的变异 。
三、新冠病毒抗原表位分析系统-SAS 。该应用模块能够计算分析所有S蛋白突变体的表位、表位区域和潜在的抗原性 。在此基础上,针对新出现的漂移突变体生成监测报告,并进一步提示具有代表性的mAbs的免疫保护覆盖率的动态变化 。数据库预先定义的表位区域包括验证表位和预测表位 。对于每个被查询的突变体,用户可以操作抗原聚类树或热图来可视化查询、对比S和基准S蛋白之间的抗原性相似度 。提供mAbs动态监控,支持以折线图图标形式,帮助监测抗原性的变化,方便mAbs疫苗的开发,同时还可以针对S蛋白突变,评估其对疫苗保护作用的影响 。