陈润生院士:生物大数据分析带来的精准预测,是预防重大疾病的关键( 三 )
引用一篇文献 。 如果关心这个问题 , 可以看2010年12月17日的《Science》 , 上面统计了最近十年(2001到2010年)自然科学领域中人类最希望、最需要解决的重要问题 。 首先是Genome’s“DarkMatter”(基因组当中的暗物质) , 这告诉了我们 , 遗传密码很容易测 , 但解析遗传密码的路还很长 。
举几个例子说明没有解析这部分暗物质对疾病治疗的影响:
第一个例子是现在医院里常规检测的指标中 , 有些肿瘤的指标是没有变化的、正常的 。 但它的变化来自于没有解析的97% , 说明97%的暗物质都与肿瘤的发生有关 。
第二个例子 , 研究肿瘤的恶性程度和肿瘤干细胞的恶性程度是否只是由现在了解的信息参与呢?其实不是 , 没有充分破解的97%其实跟人的健康紧密相关 。
第三个例子 , 现在很多晚期肿瘤病人希望做PD1、PDL1治疗 , 我们考虑来自97%的地方是否也起到了像PD1那样的作用 。 研究结果充分证实了 , 不仅仅PD1可以影响肿瘤微环境 , 很多因素都可以影响到肿瘤的微环境 。 所以 , 另外97%是有待于创新和挖掘的广大源泉 。 利用好大数据 , 一定可以更好地为人类健康、尤其是为解决严重疾病问题服务 。
3人工智能与高性能计算对大数据分析的作用
随着生物医学进入大数据时代 , 很多过去不常见的数据都变成了生物医药相关的大数据 , 比如电子病历、可穿戴设备 , 一个手环记录的生理的指标;医院里影像学超声、CT这样的影像学 , 组学处置过程中动态的变化;微生物、大气中的雾霾、水文中的化肥农药 , 以及本地辐射等等 。
大数据自身的建模与挖掘也是当前生物医学领域面临的棘手问题 。 看它的数理特征 , 生物医药大数据依然是足够的复杂 , 是多尺度、高维度、异质化的 , 也是动态含时的 , 作用方式不像物理和化学体系是标量 , 生物体系是向量 , 是有向的、是非线性的 。 随着对97%遗传密码的认识加深 , 我们知道构成生物网络的元件不仅仅是蛋白 , 也包括97%的核酸 , 所以网络的基本元件是双色的 。
大数据挖掘成为一个极端复杂的问题 。 而处理这些数据 , 有赖于高性能计算和计算机领域其他科学家的支援和帮助 。
目前 , 人工智能在生物领域中也展示了很大的作用 。
一是结构预测 , AlphaFold2这些人工智能技术可以很好地预测蛋白质的结构 , 预测精度达到了实验的90%以上 , 换句话说 , 是可用的 。 这是我自己以前做生物大分子计算没有想到的 , 所以用这样的技术能够预测天然蛋白值的85% , 同时为核酸预测提供了很好的模式 , 为核酸疫苗、核酸药物的设计开拓了很好的前景 。
二是影像学方面 , 目前用人工智能构建的影像系统超过了任何一个独立的医生的准确度 , 比如DeepMind通过处理数以千计的视网膜扫描图像 , 训练出了一种人工智能算法 , 可以比人类医生更加高效、准确地检查出眼底疾病 。 这展示了人工智能对生物大数据处理的精度和作用 。 这个作用会向大数据的其他方面延展 , 而为生物医药提供更好的工具 。
文章图片
30多年前 , 我自己也构造神经网络 , 用来预测基因 。 现在我自己觉得 , 在人工智能当中 , 可能有两个方面应当重视 。 一是现在的人工智能的基本理论和当初做的在实际本质上并没有根本性的差别 , 只是技术上有差别 , 一是规模扩大了 , 另外是收敛有所改进 。 我们的系统是全局收敛 , 现在因为参数的增加 , 全局收敛的计算复杂度比较高 。 我自己觉得人工智能的模式、理论、技术可能有待于进一步的完善和发展 。 对于生物医学工作者而言 , 如何构造一个很好的学习集 , 是充分发挥人工智能作用的重要环节 。
- 王中林院士的拓展麦克斯韦方程,这项成果究竟有多大?
- 最强同桌!袁隆平的中学同桌也是院士
- 联想|中国院士公布数据,央视正式发声,联想事件越来越清晰了
- 国内半导体量子计算再迎新进展!中国科学技术大学郭光灿院士团队与美国、澳大利亚研究人员及本...|我国实现硅基自旋量子比特的超快操控,速率创国际
- |人类关节病治疗迈出一大步,奔跑吧!用你的“生物改造膝盖”
- 信华生物|经纬创投领投,AI驱动大分子药物研发企业信华生物完成1亿元Pre-A轮融资
- 细胞分布|3D打印让微生物“互掐”变“协作”,最大化生物过程效率
- 星巴克|中国院士公布数据,央视正式发声,联想事件越来越清晰了
- 达尔文生物完成A+轮融资 国家中小企业发展基金领投
- 【能源人都在看|最新观点丨王国法院士:建立煤炭智能柔性开发供给体系