下一种“肆虐”人类的动物病毒是什么?AI预测出18种“高潜力”病毒

新冠病毒自2019年开始席卷全球 , 至今仍未完全结束 。
如今 , 新冠疫情已经给人们的生产生活造成了极大的干扰和破坏 , 且新冠病毒只是一大批日益增多的动物传染病病毒中的一种 , 新冠不是第一种人畜共患病 , 也不会是最后一种 , 其他比较“知名”的人畜共患病还包括埃博拉、中东呼吸综合征、西尼罗河热以及裂谷热等等 。
很多研究表明 , 人类活动的扩张、对野生生态的破坏 , 加剧了某些疾病从动物向人类自身的传播概率 。 近年来 , 大多数新出现的人类传染病(如COVID-19)都是人畜共患的——由源自其他动物物种的病毒引起 , 如果能及早识别这类高风险病毒 , 则可以改善相关研究和监测重点 , 有望预防此类疾病未来再次暴发 。
9月29日 , 来自英国格拉斯哥大学的研究人员在PLOSBiology期刊上发表的一篇论文中介绍 , 他们使用病毒基因组的机器学习技术(一种人工智能模型)可以预测任何动物病毒感染到人类的可能性 , 这为预测评估人畜共患病潜力提供了一个新工具 。
下一种“肆虐”人类的动物病毒是什么?AI预测出18种“高潜力”病毒
文章图片
人畜共患病病毒监测工作中捕获的蝙蝠|PLOSBiology
破解挑战的思路方法
确定人畜共患病的威胁是一项重大挑战 , 因为在大概167万种动物病毒中 , 只有其中少数可能会感染人类 。
现有的人类感染风险模型依赖于新发现病毒未知的病毒表型信息(例如 , 病毒可以感染的物种多样性) , 或是病毒毒株的风险水平(如细胞质中的复制能力) , 这些都限制了所讨论的病毒被表征之前的预测价值 。
研究人员认为 , 由于现在大多数病毒都是使用非靶向基因组测序发现的 , 通常涉及许多同时发现的表型数据有限 , 因此理想的方法是仅从序列数据中量化相关暴露后人类感染性的相对风险 。
目前已有的模型可以从基因组序列中识别出充分表征的人类感染病毒 , 然而 , 通过在非常密切相关的病毒(即同一物种的毒株)上训练算法 , 可能忽略与感染能力相关的病毒基因组的次要特征 , 此类模型不太可能找到在病毒间泛化的人畜共患病状态信号 。 因此 , 预测可能对当前病毒多样性知识中的大量偏差高度敏感 。
经验和理论证据表明 , 病毒基因组中存在可概括的人类传染性信号 。 与广泛的动物宿主分类群相关的病毒(如灵长类动物、啮齿类动物)可以使用其基因组组成的各个方面进行区分 , 包括二核苷酸、密码子和氨基酸偏差 。 这种病毒基因组组成的测量方式是否足够特异性以在物种水平区分宿主范围仍不清楚 , 但它们的特异性可能通过几种常见的假设机制产生:
首先 , 针对病毒基因组中核苷酸基序的抗病毒免疫方面 , 可能会选择不同人类相关病毒中的常见突变;
其次 , 病毒基因组中特定密码子的频率通常与其宿主的频率相似 , 这可能是由于提高了mRNA翻译效率或准确性所致;
最后 , 即使没有对不同病毒基因组施加共同选择压力的机制 , 病毒的系统发育相关性也可以预测人类传染性的可能 , 因为通常假设密切相关的病毒具有共同的表型和宿主范围 。
下一种“肆虐”人类的动物病毒是什么?AI预测出18种“高潜力”病毒】基于先前已发表的报告评估人类感染能力的大型病毒数据集 , 研究人员开发了机器学习模型 , 该模型可使用从病毒和人类基因组序列中提取的特征 , 来预测任何动物感染病毒在给定生物相关暴露的情况下感染给人类的可能性 。
18种病毒人畜共患潜力非常高
研究人员从包含动物感染物种的36个病毒家族的861个RNA和DNA病毒物种中收集了具有代表性的基因组序列 , 将每种病毒标记为能够感染人类 , 或者不使用已发表的报告作为基本事实 , 并训练模型对病毒进行相应分类 。 在这些数据中 , 识别潜在的或未记录的人畜共患病是研究分析的一个先验目标 。