- 深度学习在医学图像中的应用
- 郑光远
- 28字
- 2023-02-28 20:31:22
基础篇 医学图像计算机辅助检测与诊断、深度学习算法基础知识
绪论
医学图像(Medical Imaging)是指为了医疗或医学研究,对人体或人体某部分以非侵入方式取得内部组织图像的技术与处理过程。随着各种科学技术的迅速发展,医学图像技术也有了飞速进步[1],逐渐形成了以X射线(包括CT)、磁共振成像、超声和核医学为代表的多种医学图像方法[2]。目前应用于医疗的图像技术主要有基于X射线、超声波、伽马射线、磁共振、光学摄影(内视镜)和其他成像技术(如荧光血管显影术、显微镜等)。医学图像逐渐在疾病诊断中变得不可或缺[3],特别是在癌症诊断中与活检相结合,逐步成为精确定论的重要依据[4]。但随着科学技术的发展和医学图像应用的推广[5],有越来越多的医学图像需要医生解读[6]。医学图像解读逐渐成为一个挑战性的工作[7],医生有可能会因为经验不足或疲劳而产生解读错误,疏忽、遗漏一些疾病[8],导致假阴性出现[8-15],也可能将非病变解读为病变或将良性病变误解读为恶性,导致假阳性出现。据统计,医学图像的疾病误诊率可达10%~30%[14,16]。由此产生的假阴性结果会使患者错过最佳的治疗时机,而假阳性病例一般要依靠活检等临床手段排除,不但增加了患者的费用,也增添了痛苦和病情恶化风险。在此形势下,计算机辅助检测(Computer Aided Detection,CADe)与计算机辅助诊断(Computer Aided Diagnosis,CADx)最终应时代的需求之运而生[7,9,17]。
1963年,Lodwick等发表了把X线片数字化的方法[18,19],基于医学图像的CAD开始产生,在此领域的研究也开始活跃[20,21]。现在CAD通常被看作医生的诊断决策参考[22,23]和“第二意见(second look/opinion)”[12,24]。CAD虽然能减轻医生的工作负担[25],但不能替代医生诊断[11]。经过50多年的发展,特别是近些年,医学图像CAD系统研究成果丰硕,已经成为医学图像学和放射诊断学领域的热门课题[13],在各种疾病诊断中被广泛应用[26]。CAD系统对于疾病的早期筛查尤为重要。早期筛查对于疾病诊断、治疗起着重要的作用。肺癌、乳腺癌、结肠癌和前列腺癌是目前四大患病率和死亡率较高的疾病。肺癌是世界上患病率[27]和致死率最高的癌症。2015年统计表明,在中国约有4 929 000新增癌症病例和2 814 000个癌症死亡病例[28]。在美国每年约有221 200新增癌症病例,死亡158 040人,肺癌的总体5年存活率为16.8%[29]。早期筛查是降低肺癌死亡率最有效的方法[30]。肺部筛查检查出的癌症患者85%为临床Ⅰ期,他们的10年存活率为88%[31]。乳腺癌早期筛查项目能减少30%~70%的致死率[32]。大多数结肠癌来自息肉,而息肉转变成癌症一般要5~15年的时间,早期检测和去除10mm以下的息肉能有效减少结肠癌的发病率[33,34]。前列腺癌目前在美国男性中是发病率最高的癌症[35],早期发现和切除病灶是疾病治疗和提高患者生存率最有效的方法[36]。
目前,学者对CAD系统的研究针对以上四种癌症的较多。本书先以这些医学部位为主线,结合由不同成像技术所产生的不同特性的医学图像,从应用CAD系统较多的病类出发,对医学图像CAD系统近几年的研究进展进行综述;然后介绍深度学习算法的发展过程及不同时期的代表算法;最后以基于CT医学图像的肺结节计算机辅助诊断为例,介绍几种基于深度学习的医学图像分析诊断应用的具体案例。
本书按内容分为两篇:基础篇和应用篇。基础篇内容涵盖绪论、第1章和2章,主要综述了医学图像辅助诊断和深度学习的历史发展及基本概念,适合初学者阅读和学习。应用篇内容主要是以肺结节诊断为例介绍了深度学习在医学图像分析应用的几个案例,这可以供初学者延伸学习,以及研究者学术参考。具体内容组织如下:
基础篇:医学图像计算机辅助检测与诊断、深度学习算法基础知识
绪论,介绍本书的研究背景与研究意义,说明了癌症对人类健康的重要影响以及计算机辅助诊断对癌症早期诊断的重要性,进而阐述了本书的研究目标与主要研究内容。
第1章综述目前已有的医学图像计算机辅助诊断方法,以4种发病率高的癌症为主线,按不同的成像技术和病类,对目前不同医学图像领域的计算机辅助诊断方法进行了较为详尽的综述,从图像数据集、算法和评估方法等方面作多维度梳理,分析了医学图像计算机辅助诊断研究领域目前存在的主要问题和面临的挑战。
第2章介绍了深度学习算法的发展和演变历程,以及一些具有里程碑意义的算法。深度学习算法的产生分别经历了最初的萌芽推理期、后来的知识期和当前的学习期。在不同时期产生的经典算法对人工智能算法的发展起到了关键的推动作用,如专家系统、多层感知机、BP神经网络、SVM、Boosting算法、LR、LeNet、AlexNet、VGG-Net、GoogLeNet、ResNet和DesNet等。
应用篇:深度学习算法应用于肺结节诊断案例
第3章介绍针对肺结节诊断应用计算机辅助检测、诊断的研究背景与研究意义,说明了应用新技术所进行的肺结节征象分类对肺癌早期诊断的重要性。
第4章引入人工免疫优化策略,提出了用于肺结节征象分类的深度网络融合方法。该方法以深度网络实现分类,将每一个深度网络分类器看作一个抗体。多分类器融合时,首先随机为每个深度网络分类器分配不同的融合权值;而后根据深度网络的分类亲和度和剩余网络相似度值,对其融合权值进行克隆和变异,并从融合体中淘汰分类亲和度低且剩余网络相似度低的网络;最后得到一个能够误差抵消、优势互补、性能鲁棒的分类器融合体。
第5章提出了结合半监督协同学习与深度学习的征象模糊分类方法。首先,获得一个基于深度特征的协同森林分类器,其中引入模糊策略来代替协同森林中原有的硬分类策略,以消除由于噪声带来的影响,增强分类健壮性;而后,利用生成对抗网络生成大量无标注征象样本;最后使用协同训练方法,利用协同森林对无标注样本进行分类,相应扩增标注样本集,再利用扩增标注样本集对协同森林进行重训练。这一扩增样本和分类器重训练交替进行,直至基于深度特征的协同森林分类性能达到最优。
第6章提出了胶囊网络的三元组强化学习及其征象分类方法。该方法以胶囊网络为基础,并结合“类内样本特征表达更近、类间更远”的三元组学习目标来实现分类器的强化学习。按照强化学习语境,模拟医生工作环境,胶囊网络从环境中接收图像(视为“状态”)并执行分类(视为“动作”),学习目标是能得到最大长期回报从状态到动作的最优策略。首先用单个胶囊网络做前期学习,根据环境奖励计算当前行为策略的Q值与期望值存在的差距,参照差距更新自己的网络参数。当性能达到上升瓶颈后,再利用三元组学习目标做进一步优化,使参照样本图像与正样本图像的距离缩小,且与负样本图像的距离增大,从而能够更精细地区分不同类别。
第7章后记,对本书进行了总结,说明本书的主要研究内容及贡献,在此基础上,对未来研究工作进行了展望。