2024年MIA最新生成综述:基于深度学习的MRI/CT/PET合成【文献阅读】
基本信息
摘要: 由于复杂且非线性的域映射,两种图像模态之间的转换存在困难。与传统图像合成方法相比,基于深度学习的生成建模在合成图像对比应用中表现出更好的性能。本调查全面回顾了2018年至2023年期间基于深度学习的医学图像转换在伪CT(pseudo-CT)、合成MR(synthetic MR)和合成PET(synthetic PET)方面的研究。我们概述了最常用的用于医学图像合成的深度学习网络。此外,我们对每种合成方法进行了详细分析,重点关注它们基于输入域和网络架构的多样化模型设计。我们还分析了从传统CNN到最近的Transformer和Diffusion模型等新颖网络架构。该分析包括比较损失函数、可用数据集和解剖区域,以及图像质量评估和其他下游任务中的性能。最后,我们讨论了文献中存在的挑战,并提出了可能的未来方向。我们希望本调查论文所提供的见解将为医学图像合成领域的研究人员提供宝贵的路线图。
章节速览
本文的动机和贡献:由于先进深度学习框架的迅速发展,医学图像合成在最近的文献中取得了有希望的结果。这些方法允许在不同的成像模态之间进行准确的转换,并合成出临床上有用的结果。
受到这个快速发展的领域的启发,本文对基于深度学习方法在跨模态医学图像合成中的应用进行了全面的研究,提供了文献的参考和分析。图1简要介绍了文献中基于深度学习的医学图像合成网络的时间序列。本综述的主要贡献如下:
做综述,查文献如何检索论文?我们可以学习下论文里的方法
检索条件:我们使用 Scopus 和 PubMed 数据库进行文献搜索,查找从2018年至2023年7月发表的相关文章,搜索词为(“synth *” OR “pseudo” OR “translat *”)AND “deep learning” AND(“medical imag *” OR “CT” OR “MRI” OR “MR” OR “PET” OR “low dose” OR “low count” OR “low field”),在标题、摘要或关键字中进行搜索。
还使用 Google Scholar 识别可能的遗漏,并排除综述文章。我们首先筛选标题和摘要,考虑包括同行评议的期刊和会议论文等纳入标准,并排除与图像超分辨率和重建等不相关的主题。
经过全文审阅和交叉参考,共包括173篇文章。图2说明了文献综述搜索流程中所遵循的方法论过程。
我们按照论文给的这个关键词,去Pubmed检索出了189篇文献,如果去掉综述性文章,就跟论文检索出来的结果差不多
U-Nets
我们都知道UNet是分割网络,它同样可以用于图像合成。损失函数可以使用平均绝对误差(MAE)或均方误差(MSE)进行计算。这些损失函数衡量合成图像与真实图像在强度值上的差异
生成对抗网络
根据原始GAN架构,已经开发了各种针对特定生成任务的GAN网络。深度卷积GAN(DCGAN)通过将GAN与CNN集成在一起,使得该架构更适合图像生成。
条件生成对抗网络(cGAN)常用于医学图像合成,通过向目标函数添加约束来增强模型的可控性,该约束可以是另一种模态下的标记数据甚至是图像。
CycleGAN使用两个生成器和判别器模型,在没有成对图像的情况下,在两个领域(A和B)之间进行图像转换。
Vision transformers
基于Transformer的架构因其能够把握全局图像上下文的能力而受到广泛关注。其中最重要的模型是Vision Transformers(ViT)
在ViTs中,图像被划分为非重叠的图像块序列。这些块通过编码器进行处理,然后经过特定任务的解码器模块。重要的是,在图像块之外,相关的位置信息也被整合到编码器块中。该块由多头自注意力(MHSA)、归一化和多层感知器(MLP)层组成,
如图6所示。通过MHSA层,为嵌入的图像标记生成注意力图,从而使网络能够有选择地优先处理图像中最显著的区域。
Denoising diffusion probabilistic models
噪声扩散概率模型(DDPMs)是 2020 年首次提出的一种新颖方法,它表现出优秀的建模生成过程的能力。
如图7所示,DDPMs是一个参数化的马尔可夫链,通过在有限的时间步骤T内逐渐将纯噪声映射到真实数据进行训练。
医学图像合成方法涵盖了多种模态,包括伪造CT或合成CT、PET和MR。这些方法可以根据它们的应用来进行分类,如在不同模态之间进行图像转换,或者在同一模态的两种不同对比度之间进行转换。
图8展示了合成MR、PET和CT模态的示例,并突出了它们的基本特征。
常见的图像合成应用包括:
卷积神经网络(CNN)和基于生成对抗网络(GAN)的方法在精确估计CT Hounsfield Units(HU)方面显示出巨大的潜力。此外,新颖的Transformer和基于Diffusion的网络在高保真合成图像方面表现出卓越的性能。本节回顾了基于深度学习的CT合成方法。
表 1 概述了基于深度学习的伪 CT 方法,按其特征属性进行分类,总结了每个类别中最相关的研究,同时强调了它们的新颖性、网络类型、损失函数、输入模式和数据区域。
表 2概述了基于深度学习的合成 MR 方法,按其主要特征属性进行分类。本摘要概述了每个类别中最相关的研究,强调了有关网络类型、损失函数和 MRI 转换的主要新颖性和细节。
表格太长,未显示完全。详细看论文
T2-FLAIR互转示例
表 3 概述了基于深度学习的合成 PET 方法,按其特征创新进行分组。本摘要重点介绍了每个类别中最相关的研究,强调了主要贡献以及网络类型、损失函数、输入数据和区域的详细信息。
图12显示文献中用于医学图像合成的深度神经网络架构的概述。
这部分包括各种模型以及损失函数的介绍。详细看论文。
医学图像合成的研究采用了各种图像模态和数据集来生成合成图像。对于从 MR 图像进行 CT 合成,在配对和未配对 CT 图像的实验中使用了不同的 MR 对比度。大多数数据集都是私有的,不公开。
表 4总结了医学图像合成中使用的公开数据集。
医学图像合成的定量分析最常采用的评估指标是 MAE、峰值信噪比 (PSNR) 和结构相似性指数 (SSIM) 。MAE 计算合成图像和源图像之间的平均像素差异,PSNR 评估合成图像是否是真实图像的均匀投影,SSIM 专注于图像的可见结构。除了这些指标之外,还包括 MSE、均方根误差(RMSE)、Frechet 起始距离 (FID)、归一化均方根误差(NRMSE)、归一化均方误差 (NMSE) 和皮尔逊相关系数 (PCC),归一化互相关(NCC)
图 13总结了每个图像合成类别中不同网络类型的评估结果,包括获得的 PSNR、SSIM 和 MAE 值。
虽然评估传统上侧重于合成图像的质量,但一些研究已将其评估扩展到下游任务,例如分割或分类,以确定临床有效性。我们概述了有关合成 CT、MRI 和 PET 的评估,以强调其临床适用性。
例如在肝脏分割作为下游任务的背景下,Chen等人(2021年)获得了0.97的DSC。此外,Boroojeni等人在使用合成的CT图像和MR颅骨成像时报告了更高的准确性,其DSC为0.90。
尽管医学图像合成在临床实践中具有广泛的应用和优势,但医学图像合成仍然存在共同的挑战,需要在各个领域进行进一步的研究。
尽管医学图像合成在临床实践中具有广泛的应用和优势,但医学图像合成仍然存在共同的挑战,需要在各个领域进行进一步的研究。包括:
文章持续更新,可以关注微公【医学图像人工智能实战营】获取最新动态,一个关注于医学图像处理领域前沿科技的公众号。坚持以实践为主,手把手带你做项目,打比赛,写论文。凡原创文章皆提供理论讲解,实验代码,实验数据。只有实践才能成长的更快,关注我们,一起学习进步~
我是Tina, 我们下篇博客见~
白天工作晚上写文,呕心沥血
觉得写的不错的话最后,求点赞,评论,收藏。或者一键三连