腾讯刘伟:AI药物发现存在一个核心问题,即模型是否具备泛化能力

萧箫整理自MEET
2023量子位|公众号QbitAI
AI制药 , 一个被称作明星赛道的行业 。
不仅融资消息隔三差五传出 , 更被认为是计算生物最有希望落地的领域 。
据量子位智库预测 , AI制药行业国内市场保守估计将达到2040亿元规模 。
在这样的前景下 , 不仅国内外高校博士生和教授纷纷投身创业 , 就连互联网大厂们也争相入资角逐 。
如今AI制药步入热度高峰后的瓶颈突破期 , 各玩家的差异性也逐步显现 。
作为国内互联网巨头的腾讯 , 相比间接投资 , 三年前选择直接成立AI制药平台 , 成为赛道上角逐玩家之一 。
现在 , 腾讯AI制药平台成果进展如何?相比同赛道玩家 , 其竞争优势是否得以体现?
在MEET2023大会上 , 腾讯医疗健康AIDD技术负责人刘伟 , 从腾讯制药AI算法实践的角度探讨了这一行业当前的现状 。
腾讯刘伟:AI药物发现存在一个核心问题,即模型是否具备泛化能力
文章图片
为了完整体现刘伟的分享及思考 , 在不改变原意的基础上 , 量子位对他的演讲内容进行了编辑整理 。
关于MEET智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会 , 致力于探讨前沿科技技术的落地与行业应用 。 今年共有数十家主流媒体及直播平台报道直播了MEET2023大会 , 吸引了超过300万行业用户线上参会 , 全网总曝光量累积超过2000万 。
演讲要点在AlphaFold和AlphaFold2驱动下 , AI药物行业发展速度非常快 , 而腾讯在蛋白质结构预测上的工作从2019年初就开始了 。 骨架跃迁分子生成算法能在保证原有化合物活性的基础上 , 突破原有分子专利的保护 , 或者优化分子的ADMET性质 。 只靠数据驱动的AI缺乏可解释性 , 要与领域知识相结合;药物AI是AI算法和领域知识相互发现 , 相互提升的过程 。 AI辅助药物发现存在一个难题就是泛化性 , 即在A靶点中训练的AI模型 , 通常难以应用到B靶点上做预测 。 这个问题的解决对技术的突破至关重要 。(以下为刘伟演讲分享全文)
腾讯云深智药是一个怎样的平台?我分享的题目为“腾讯制药AI算法实践” , 会对腾讯过去3年积累的AI制药技术进行一个展示 。
我叫刘伟 , 是腾讯AI药物发现这一块的技术负责人 。 今天我要讲的内容 , 主要包括三个部分:
第一部分是腾讯云深平台介绍 , 它实际上是沉淀了腾讯AI制药技术的一个平台;第二部分是平台的案例分享;第三部分总结平台的技术优势 。
我们先介绍一下腾讯云深平台的两大功能模块 , 一个是小分子药物发现 , 另一个是大分子药物发现 , 这里主要指抗体药物发现 。
其中 , 小分子模块包括蛋白质结构预测、分子生成等6个模块 , 大分子模块则由抗体结构预测、抗体亲和力、以及抗体人源化改造等几大模块组成 。
腾讯刘伟:AI药物发现存在一个核心问题,即模型是否具备泛化能力
文章图片
时间有限 , 我们不会详细介绍每一个模块 , 主要会讲案例以及部分底层技术的实现 。
腾讯云深平台四大案例分享第一个案例是蛋白质结构预测 , 这块腾讯在国内可能是做得最早的 。
最近在AlphaFold和AlphaFold2的驱动下 , 行业发展速度非常快 , 而腾讯从2019年初就开始做相关技术工作 。
大家应该比较清楚 , 蛋白质是生命及其活动中非常重要的组成部分 , 蛋白质结构预测则是指给定一个氨基酸序列 , 来预测蛋白质的三维结构 。
我们在2019年打造的一个预测pipeline , 当时是基于分子动力学模拟和AI预测相结合的方法 , 构建了一个叫tFold的蛋白质结构预测平台 。