欧洲影像学人工智能和影像组学文章审稿指南解读--用于训练/验证AI/影像组学的参考标准是否可靠？

发布时间：2023年12月28日

欧洲影像学人工智能和影像组学文章审稿指南解读

针对人工智能（AI）和影像组学领域的研究文章，欧洲影像学（European Radiology）期刊为审稿人提出了一系列特别的说明和要求。这些要求不仅仅是审稿的准则，更是反映了医学人工智能领域的最新发展趋势和研究热点。通过深入理解这些审稿要求，研究人员和学术作者可以更好地把握医学人工智能研究的前沿动态，指导自己的研究方向和论文撰写。这意味着，作者在撰写论文时，不仅要关注其科学性和创新性，还需紧密跟随医学AI领域的发展脉络，确保研究内容符合学术界当前的重要议题和技术进展。同时，这也提示作者们在论文结构和论据上做到严谨细致，以适应审稿标准的严格要求，从而提高论文的接受率和学术影响力。此外，欧洲影像学期刊的审稿要求不仅是审稿规则，更是医学AI研究领域发展趋势的一个缩影，对研究者而言，这是一个理解和把握学科发展，优化研究和论文质量的重要参考。

本手稿是否专注于AI/影像组学的报告？

请告知手稿的主要焦点是否为AI/影像组学，例如：

AI模型的开发

应用自主开发的AI模型或市售AI驱动产品

影像组学模型的开发和验证

请注意：

此处的影像组学指的是描述灰度值分布的复杂数学特征的提取，例如GLRLM、GLSZM等，就像这里所描述的。更简单的影像生物标志物，如ADC值或简单的形态测量，不应被视为影像组学，以避免混淆。基本的机器学习模型，如线性回归，在此不被视为人工智能，而更复杂的方法，如支持向量机、随机森林等，则属于此审查范畴下的人工智能。

对于欧洲影像学这一审稿要求，研究者和作者应注意以下几点：

**1.明确手稿主题：**确认手稿是否集中在人工智能（AI）或影像组学方面。这包括AI模型的开发，使用自主开发或市售的AI驱动产品，以及影像组学模型的开发和验证。

**2.理解影像组学的定义：**影像组学涉及描述灰度值分布的复杂数学特征提取，如灰度长程依赖矩阵（GLRLM）、灰度尺寸区域矩阵（GLSZM）等。重要的是要区分这些复杂特征与更简单的影像生物标志物（例如ADC值或基本形态测量），后者不应被视为影像组学。

**3.区分AI与基本机器学习模型：**基本的机器学习模型，如线性回归，在此不被视为AI。相反，更复杂的方法，如支持向量机、随机森林等，则被认为是人工智能的一部分。

研究者和作者应该清楚地界定他们研究的范围，确保他们的工作聚焦于AI或影像组学的高级应用，同时避免将简单的影像分析或基础的机器学习模型误认为是审稿要求所指的AI或放射组学。

所呈现的AI/影像组学方法是否对临床实践相关？01

在某些情况下，概念证明可能对我们的读者群有趣。然而，作为一个临床影像学期刊，我们鼓励作者详细讨论所提出的AI/影像组学模型的影响。

该模型会如何影响患者管理？是否有不同的治疗选项？

该模型是否足够准确和可靠，以致可以安全地省略替代方法（例如，能否避免活检/手术）？

请注意：

例如，预测非小细胞肺癌中特定基因突变的模型可能不会对临床常规产生太大影响，因为应用该模型时需要对非小细胞肺癌进行组织病理学确认，届时可用于基因检测的标本将可得。同样，功能有限的模型（例如，区分HCC与肝血管瘤）可能不实用，因为未评估重要的鉴别诊断（如CCC、肝腺瘤等）。如果没有提出/讨论个体化护理的选项，那么“可用于指导更个性化的治疗”的说法可能对我们的读者群没有帮助。

在针对这一审稿要求时，研究者和作者应注意以下几点，以确保其人工智能（AI）/影像组学方法与临床实践的相关性：

1.临床影响讨论：应详细讨论AI/影像组学模型如何影响临床实践，包括患者管理和治疗选择。例如，模型是否能提供不同的治疗方案？是否通过其准确性和可靠性，能够安全地省略传统的替代方法（如避免进行活检或手术）？

2.模型的临床重要性：**评估模型对临床常规的实际影响。例如，如果一个模型预测肺癌中的特定基因突变，但在实际应用中需要进行组织病理学确认（此时已可进行基因检测），那么这种模型可能对临床实践影响有限。

3.模型的功能限制：识别并避免功能有限的模型。例如，仅能区分肝细胞癌和肝血管瘤的模型可能不够实用，因为它没有评估其他重要的鉴别诊断（如胆管细胞癌、肝腺瘤等）。

4.个体化护理的讨论：如果论文声称该模型可以用于指导更个性化的治疗，但未具体讨论个体化护理的选项，这可能对读者帮助不大。

作者需要确保其研究不仅科学先进，而且对临床实践具有明确和实际的意义，特别是在患者管理和治疗选择方面。论文应充分讨论模型在临床应用中的优势、局限性和实际应用场景，以便更好地服务于临床放射学领域的读者。

在这里插入图片描述

用于训练/验证AI/影像组学的参考标准是否可靠？02

训练/验证AI（或影像组学）模型的参考标准应尽可能可靠。好的参考标准是通过独立客观测试获得的，具有结构化结果，如：

实验室测试

组织病理学

结果数据

请注意：

在某些情况下，这种客观测试可能不可行或不可用。然而，参考标准需要被清晰地定义和报告。从非结构化数据中自动提取标签（例如，使用NLP从影像学报告中提取数据）可能由于NLP算法的不完美而引入相关错误。单个读者的视觉评估不是一个可靠的参考标准，而多个读者的共识可能是有效的。理想情况下，不同模式下多个读者的共识甚至更有效（例如，如果AI要在X光片上检测微妙的骨折，对同一病例的CT扫描的共识阅读可以是一个有效的参考标准）。

也就是说，研究者和作者应特别注意其人工智能（AI）或放射组学研究中所用的参考标准的可靠性。以下是一些关键点：

**1.参考标准的可靠性：**训练和验证AI或影像组学模型时，所用的参考标准必须尽可能可靠。理想的参考标准通常是通过独立客观测试获得的，例如实验室测试、组织病理学结果或其他客观的结果数据。

**2.结构化结果的重要性：**参考标准应具有结构化的形式，以提高其准确性和可靠性。

3.情况的特殊性：在某些情况下，获取客观测试可能不可行或不可用。即便如此，所使用的参考标准需要被清晰地定义和详细报告。

**4.自动化标签提取的局限性：**从非结构化数据（如放射学报告）中使用自然语言处理（NLP）自动提取标签可能会因NLP算法的不完善而导致错误。

**5.多个读者共识的有效性：**单个读者的视觉评估可能不够可靠，但多个读者的共识通常被认为是有效的参考标准。在理想情况下，不同模式下（例如，X光片和CT扫描）多个读者对同一病例的共识阅读甚至更有效。

为了保证AI/影像组学研究的准确性和科学性，选择和定义参考标准时应格外谨慎，确保其客观性、可靠性和明确性。这对于提高研究的质量和可信度至关重要。

AI/影像组学的性能是否与人类读者或临床模型进行了比较？02

为了具有临床相关性，任何

AI/影像组学方法都应与人类读者的性能、仅基于临床信息的模型或任何其他临床意义上的比较进行比较，例如：

基于影像特征预测生存率的模型可以与包括临床数据（如年龄、pTNM等）的模型进行比较。

在MRI中区分HCC与肝血管瘤的模型可以与人类读者的评估进行比较。 AI/放射组学性能与替代方案的比较应使用适当的统计测试进行。

在遵守欧洲影像学审稿要求时，研究者和作者应注意以下几点，以确保他们的AI/放射组学研究在性能上与人类读者或临床模型进行了有效比较：

**1.比较的必要性：**为了确保AI/影像组学方法在临床上的相关性，这些方法的性能应该与人类专家的评估、基于纯临床信息的模型或其他具有临床意义的参考标准进行比较。这有助于展示AI/影像组学方法在实际临床环境中的有效性和优越性。

**2.比较的例子：**比如，一个基于影像特征来预测生存率的模型，可以与包含年龄、pTNM等临床数据的模型进行比较；或者，在MRI中区分肝细胞癌和肝血管瘤的模型，可以与人类放射科医师的评估进行比较。

****3.使用适当的统计测试：****在进行这些比较时，应使用适当的统计方法来验证AI/影像组学方法与替代方案之间性能的差异，确保比较结果的科学性和有效性。

对于AI/影像组学的研究，作者需要在论文中明确地展示其方法与人类专家或其他临床模型相比的性能，以及采用恰当的统计分析来支持这些比较。这种比较不仅能体现AI/放射组学方法的优势，还能增强研究的临床价值和实用性。

基于上面四条，我们可以看出欧洲放射学期刊的审稿要求强调，提交的论文应明确聚焦于人工智能（AI）或影像组学的高级领域，例如AI模型的开发和应用，以及影像组学模型的开发和验证。审稿标准要求这些研究与临床实践紧密相关，例如评估模型对患者管理的影响和治疗选择的改变。论文还需展示所使用的训练和验证AI/影像组学模型的参考标准的可靠性，并通过结构化的结果支持这些标准。此外，还要求将AI/影像组学的性能与人类专家或现有的临床模型进行比较，使用适当的统计测试来证实这种比较的有效性。这些要求旨在确保研究在科学性和临床实用性方面达到高标准。

文章来源:https://blog.csdn.net/weixin_38594676/article/details/135251030
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！