陈润生院士:生物大数据分析带来的精准预测,是预防重大疾病的关键
文章图片
整理|陈彩娴
高性能计算被誉为计算机科学的「神来之笔」 , 在过去的数十年 , 对气象、海洋、物理、生物、材料、机械工程 , 甚至人工智能等等领域均产生了重要的影响 。
换句话说 , 也就是越来越多学科在「抱CS的大腿」 。
那么 , 高性能计算的发展 , 对生物大数据的分析究竟体现在哪些方面?高性能计算与人工智能模型的结合 , 又对人类了解生物数据背后隐藏的规律与密码起到怎样的帮助?
在10月21日于珠海横琴召开的全国高性能计算学术年会(CCFHPCChina2021)上 , 陈润生院士作了题为「从大数据、精准医学到核酸药物」的主题报告 , 介绍了大数据的出现在生物领域所引起的一系列变革 。
陈润生院士是我国最早从事理论生物学、生物信息学以及非编码RNA研究的科研人员之一 , 目前在中国科学院生物物理研究所担任核酸生物重点实验室主任 , 同时是国际人类基因组织会员、国际数据库组织生物大分子专业组委员 。
以下 , AI科技评论对陈润生院士于CCFHPCChina2021的报告作了不改原意的整理:
1从大数据到精准医学
我想讲三个问题 。 第一个问题是「从大数据到精准医学」 。
近30年以来 , 生物领域发生了重大的变化 , 而变化的原因背后 , 是生物领域已经进入大数据时代 。 人的遗传密码可以测试 , 水稻的遗传密码也可以测试 。
这是一段真实的人类遗传密码(如下图) , 是一尾线性的字符串 , 但上面只有4个符号 。 遗传密码的形式非常简单 , 主要是长 , 有30亿个建基 。
文章图片
人类历史上只有最近30年才可以破译自己的遗传密码 。 能够测量遗传密码 , 也就得到了前所未有的、跟生物相关的大数据 。 大数据必然会带来大的信息 , 信息的解析给生物医学带来的冲击是巨大的 。
我们再看下面一个例子:
图的左边是高等生物的结构和遗传核酸信息链 , 右边是新冠病毒核苷酸的链 。 新冠病毒的结构远比人的简单得多 。 图中所示是从早期的武汉病人身上提取的新冠病毒完整序列 。 这个序列很短 , 人类遗传密码是3乘10的九次方 , 而新冠病毒只有29903个 。 但即便是这么短的序列 , 给我们带来的影响却是深远的 。
由于有了大数据的测量 , 新冠在武汉出现以后 , 中国科学家在一周内就测量了它的完整序列 , 而这序列在国际社会上公布以后 , 世界上最大的核酸疫苗公司Moderna用了两天时间就基于这个序列设计出了现在人尽皆知的核酸疫苗 , BioNTech公司用这样的大数据甚至只用了4个小时就设计出核酸疫苗 , 为抗击新冠起了非常重要的作用 。
所以大数据分析对生物领域的冲击、对预防新冠的影响是巨大的、是根本的 。 在2003年 , 人类用了4个月的时间才确定了SARS病原体的组成和序列;更早之前 , 20世纪的西班牙流感用了13到15年才决定了病原的性质 。 而现在 , 有了大数据 , 人类只要几天就可以确病毒的序列 , 几个小时就可以把疫苗设计出来 , 可见大数据对人类的影响是巨大的 。
我们再举一些例子 , 谈谈生物大数据对人类健康与疾病预防的作用 。
美国著名影星AngelinaJolie来自所谓的乳腺癌家族 。 过去没有大数据的测量 , 不知道病因 , 有大数据测量遗传密码后 , 她发现她的家族有基因BRCA1的突变 , 由于这么一点遗传序列的变化 , 她的家族大多数人到一定年龄就会罹患乳腺癌去世 。 在她还很年轻的时候 , 她也测了自己的遗传密码 , 发现自己也是阳性 , 所以她决定做预防性治疗 , 切掉了当时还完全正常的乳腺 , 杜绝了自己此后患乳腺癌的可能性 。
- 王中林院士的拓展麦克斯韦方程,这项成果究竟有多大?
- 最强同桌!袁隆平的中学同桌也是院士
- 联想|中国院士公布数据,央视正式发声,联想事件越来越清晰了
- 国内半导体量子计算再迎新进展!中国科学技术大学郭光灿院士团队与美国、澳大利亚研究人员及本...|我国实现硅基自旋量子比特的超快操控,速率创国际
- |人类关节病治疗迈出一大步,奔跑吧!用你的“生物改造膝盖”
- 信华生物|经纬创投领投,AI驱动大分子药物研发企业信华生物完成1亿元Pre-A轮融资
- 细胞分布|3D打印让微生物“互掐”变“协作”,最大化生物过程效率
- 星巴克|中国院士公布数据,央视正式发声,联想事件越来越清晰了
- 达尔文生物完成A+轮融资 国家中小企业发展基金领投
- 【能源人都在看|最新观点丨王国法院士:建立煤炭智能柔性开发供给体系