专家论坛|刘景丰:深度学习在原发性肝癌相关诊断模型中的应用与前景

专家论坛|刘景丰:深度学习在原发性肝癌相关诊断模型中的应用与前景
文章图片
专家论坛|刘景丰:深度学习在原发性肝癌相关诊断模型中的应用与前景
文章图片

原发性肝癌(简称肝癌)的发病率和病死率均居所有肿瘤的前5位[1],是男性癌症相关死亡的第2大原因,女性癌症死亡的第6大原因[2],2015年中国统计数字显示,肝癌是国内第4位恶性肿瘤,肿瘤致死病因则位于第3位[3] 。 大数据时代,随着人工智能的快速发展,各种数学算法也在肝癌的海量数据中得到广泛应用,数据挖掘和云计算等不断层出的分析技术,为肝癌的诊疗分析提供了更加便利的方法,涉及到肝癌病因、基因组学、代谢组学、影像组学、蛋白组学、病理学、复发预测及生存风险分析等各个方面的机器学习方法的研究[4-6] 。
机器学习是一种实现人工智能的方法,机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测,具有机器模仿、识别和学习人类大脑认知功能的作用,随着人工智能的发展也日渐受到关注[7] 。 机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务,其主要内容就是各种学习算法 。 深度学习涵盖于机器学习算法,是目前最热的机器学习算法,能基于大量积累的医疗数据产生计算模型,通过训练,在面对新的患者时,会提供相应的判断(譬如肝癌可能发生的风险、再复发的风险以及生存风险等) 。 对于癌症,与传统的方法相比,初期的机器学习即具有图像识别和特征选择的优势[8-9] 。 而近年来,深度学习算法被开发用于检测乳腺癌女性前哨淋巴结的转移,并表现出比病理学家更好的诊断性能[10] 。 在肝癌的诊断与复发领域,利用大数据平台,相对于传统的逻辑回归或Cox回归,深度学习模型表现出更好的诊断与预测性能 。 传统机器学习的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等,而机器学习的算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习,其中主要包括监督学习、半监督学习和无监督学习3种[11],如监督学习代表有:随机森林(RF)、梯度增强机(GBM)、支持向量机(SVM)、决策树、k近邻(KNN)、人工神经网络(ANN)等;半监督方法代表有:最大期望、生成模型和图算法、主成分分析等 。 无监督学习方法代表有:先验算法(Apriori)、分叉树、K-均值(K-means)以及目前比较火的深度学习[12] 。 目前,深度学习广泛应用于医学预测模型,而深度学习其本身也会用到有监督和无监督的学习方法来训练深度神经网络 。 本文将深度学习在肝癌诊断、复发中应用进展介绍如下 。
1构建模型预测肝癌发生风险应用
1.1构建血清蛋白质组学模型协助早期诊断
血清AFP是目前肝癌诊断随访复发的一种重要检查方法,仍然被认为是血清肿瘤标志物中的金标准[13] 。 早在2001年,Poon等[14]通过深度学习算法计算出了AFPcut-off值,从而首次构建了血清AFP肝癌诊断模型 。 Camaggi等[15]在2010年筛选了45例HCV相关肝硬化、早期肝癌及晚期肝癌病例,通过深度学习对522份血清样本进行训练得到多种蛋白质组学特征,其所建模型对其中43个可能区分伴或不伴肝硬化、伴或不伴血管浸润的肝癌病例进行了正确分类 。 2011年Patterson等[16]也通过深度学习,对血清中甘氨酸脱氧胆酸盐、脱氧胆酸3-硫酸盐、胆红素水平、溶血磷脂水平进行例模型训练,构建了的肝癌发生的血清学预测模型 。 2014年Wang等[17]应用同样的方法建立了HBV相关肝硬化进展的早期肝癌进行诊断的预测模型,主要通过血清肽和AFP联合检测数据训练完成 。 Estevez等[18]2017年应用随机森林训练模型建模,检测了411例HBV及HCV感染的肝细胞癌(HCC)病例的血清细胞谱,该模型从深度学习算法角度说明了有或无HCC的HBV或HCV感染者,其体内细胞因子分泌明显不同,疾病发病机制和疾病特征存在潜在差异 。 这些文献的报道,使血清学指标的检测及学习训练对各种情况下肝癌的协助诊断提供了很大的帮助 。