医疗影像AI六年记:让人工智能读报告,你愿意吗?( 三 )


中国公立医院属于非盈利机构,医院的数据资产不允许进入市场交易,没有市场定价。于是,对医疗AI公司来说,能撬动多少医院资源、接近多少医疗数据,决定着资本市场给出的估值。
头部的医疗影像AI企业大多有其医院“福地”,如安德医智与北京天坛医院,数坤与北京友谊医院,科亚与北京安贞医院等。当时,企业与医院合作皆需签订合同,用人工智能技术,服务有科研诉求的PI(学术带头人)。
医疗学术圈,顶级PI并不缺服务者。竞争之下,一些企业甚至甘愿让渡股权,与PI深度绑定。医疗AI公司和医生团队合作的过程,正是借由医院数据、训练算法的过程。
为了向公众展示AI应用临床的可能性,几年前流行“医疗影像版人机大战”,像柯洁对战AlphaGo。AI企业联合医院、协会,策划邀请影像科医生与AI软件竞技。
2018年6月,安德医智(Biomind)和中国卒中学会等机构举办了一场“判读颅内肿瘤”的比赛,赛前半年,安德医智学习了北京天坛医院近10年接诊的神经系统疾病病例的影像,公开资料称有“数万余病例”。
比赛分两组:一组判读颅内肿瘤的CT、MRI影像,另一组判读脑血管疾病的 CT、MRI。公布的结果是:安德医智分别以 87%、83% 的准确率,领先医生战队 66%、63%的准确率。
不久后,解放军南京总医院办了另一场比赛,准备了100例有肺结节病变的CT片,找了126位初、中、高级影像科医生,来与深睿医疗的辅助诊断系统PK。
那时,找到肺结节,已是医疗影像AI企业的常规技能,所以深睿AI要PK的是:更准更快地诊断肺结节的良恶性。3年前从准确性、敏感性等四个维度比较, AI超过了126位医生的平均水平,即便第一名仍是医生。
站在2018年的节点,不少影像科医生甚至担心起未来出路。但是,比赛成绩能说明临床应用效果吗?
赛后,上海长征医院影像医学与核医学科主任刘士远抛出了这个问题,在他看来,要说清这个问题,涉及到“比赛测试题来源、测试题与训练集的关系、测试题数据处理的方法”。
简单理解,如果训练算法模型的数据,主要出自一个数据源(如某一家医院),那么这个AI识别该医院的片子,效果好,“换一家医院,模型效果就完全没法看。”刘士远曾撰文点评。
某一线公募基金的董事总经理邹鹏向《财经》科普:“都是读放射学的医生,但每家医院出诊断报告的描述规范都不太一样。特别像北京这些大三甲医院,协和的规范,301不一定认。”曾在医院做过信息科主任的他,甚至直言:“当前中国没有真正的医疗大数据。”
数据之殇,成为医疗AI领域无比突显的挑战。深睿医疗的首席科学家俞益洲(港大教授,IEEE Fellow)也曾直言:医疗AI训练数据少,数据分布高度不均匀,数据标注的一致性较差,数据类型多(多模态影像,文本+影像)。
“算法当然重要,但真正拉开差距的,是数据质量、标注质量。”一位在医疗影像AI公司从业的算法工程师告诉《财经》,“你可以去看世界算法竞赛的最终结果,像Kaggle,基于同一标注数据集,大家(模型)跑出来的结果,拟合度非常接近,差异甚至要到小数点后3、4位。”
医疗影像AI六年记:让人工智能读报告,你愿意吗?
文章插图
AI圈有句话,“有多少智能,就有多少人工”,数据标注是让机器理解世界的前提。因为医疗影像的专业性,要求标注者必须有医学背景,众包的方式并不适用。一些医疗AI公司选择聘请1-2位全职医生牵头,再找医生兼职标注;或如上海联影,招聘百位全职“AI医学影像算法标注师”。
医疗影像AI六年记:让人工智能读报告,你愿意吗?