机器学习|机器学习的出现,促进了医疗保健中的自动化方法的改变

机器学习|机器学习的出现,促进了医疗保健中的自动化方法的改变

文章图片

机器学习|机器学习的出现,促进了医疗保健中的自动化方法的改变

文章图片

机器学习|机器学习的出现,促进了医疗保健中的自动化方法的改变

文章图片


机器学习已经改变了医疗保健中的自动化方法 。 尽管使用预先设计的特征与传统的机器学习方法相结合已经很流行 , 但它们的实现受到手动提取和设计特征需要的限制 。 深度学习的进步促进了对机器学习的发展 。 计算机科学中各种任务的突破性表现激发了将该技术扩展到医学领域的兴趣 。 对这些算法进行适当评估的需要是一个活跃的研究领域 。



机器学习的出现已经从根本上改变了医疗保健中的自动化方法 。 尽管将预先设计的特征与传统机器学习方法相结合的使用已经很流行 , 但它们在许多领域的实施受到手动提取和设计特征的需要的限制 。 近年来 , 深度学习的进步激发了人们对机器学习的兴趣 , 深度学习是一种使用神经网络直接从输入数据中自动学习相关模式和特征的技术 。



特别是计算机科学中各种任务的突破性表现 , 激发了将该技术扩展到医学领域的兴趣 。鉴于大部分医学依赖于实验室检查、生理信号和医学成像的解释 , 病例的使用用于医疗人工智能 (AI) 继续以惊人的速度扩张 。 然而 , 医学人工智能研究的发展并非没有危险:对这些算法进行适当评估的需求是研究、讨论和发展的一个活跃领域 。 算法泛化性是通过测量模型在新的、看不见的数据上的性能来评估的 。

如果模型过度拟合或不能很好地泛化 , 则不能保证在训练集上具有高性能的模型在临床上有用 。 现代神经网络非常庞大 , 有数百万个可训练参数 。 随着硬件的进一步进步 , 模型继续变得更广、更深、更复杂 。 相比之下 , 医疗数据集包含的数据输入要少几个数量级 。 这种差异导致容易过拟合 , 这种现象被称为维度灾难 。 因此 , 在训练集上完美或接近完美的表现对模型的泛化性没有预测价值 , 因为模型可能会记住训练数据 。




同样 , 验证集的性能也没有什么价值 , 因为它在模型训练期间不断被用于调整模型参数 。 由于信息泄漏 , 这会导致间接过载 。 另一方面 , 内部测试集确实揭示了一些关于模型泛化性的信息 , 但它的范围有限 , 因为数据通常与训练和验证集在同一分布内 。 此外 , 尽管某些算法可能在内部测试集上表现令人满意 , 但由于数据分布的差异 , 它们仍然无法在外部测试集上泛化 。



理想情况下 , 收集多个外部测试集 , 但这从逻辑角度来看可能具有挑战性 。 由于这些原因 , 外部测试集是评估模型性能的黄金标准 。 当在外部测试集上评估模型时 , 性能下降通常可归因于数据分布的变化 。 首先 , 训练集和外部集之间的患者人群在人口统计学方面可能不同 。 例如 , 在疾病流行率高的数据上训练的模型没有针对疾病流行率低的测试集进行校准 。 其次 , 不同地点的图像采集设置可能不同 。 例如 , 不同的X 射线照相系统可能具有不同的 X 射线管目标、过滤器、数字检测器技术和自动曝光控制 , 这会影响模型的普遍性 。



【机器学习|机器学习的出现,促进了医疗保健中的自动化方法的改变】同样 , 不同的磁共振扫描仪可能具有不同的场强、切片厚度、重复次数和回声次数 。 最后 , 神经网络可能在训练数据集中学到了外部数据集中不存在的混杂因素 。 例如 , 当在门诊患者的数据集上进行测试时 , 一个神经网络学习到在便携式胸片上发现肺炎的可能性更大 。 同样 , 另一项研究表明 , 神经网络可以学习将疾病状态与数据集特定的侧向标记、箭头和其他形式的注释相关联 , 如果试图训练算法来检测疾病 , 这是一个令人不安的迹象病理学 。