#41-影像组学研究中离散化方法选择
目前,尽管许多研究倾向于固定的bin数而非固定的bin宽度,但并没有硬性证据表明在所有情况下固定的bin宽度或固定的bin数更优。因此,PyRadiomics实现了设置固定的bin数(binCount)和固定的bin宽度(binWidth,默认值)两种选项。
之所以选择固定的bin宽度作为默认参数,部分原因在于PET研究表明,采用固定的bin宽度能更好地保证特征的可重复性。此外,以下示例最能说明我们的理由:假设有两幅图像和两个ROI,第一幅图像的灰度值范围为{0-100},第二幅图像的灰度值范围为{0-10}。如果您使用固定的bin数,则1(离散化)灰度值差异的“意义”是不同的(在第一个ROI中,它表示10个灰度值的差异,在第二个ROI中只是1)。这意味着您所看到的基于纹理的对比度有很大不同。
这个例子假设两个图像的原始灰度值意义相同,在灰度值明确/绝对的图像(如CT的HU值、PET成像中的SUV值)中,这是成立的。但是,在任意/相对灰度值的图像中(例如MR中的信号强度),这不一定成立。在后一种情况下,我们仍然建议采用固定的bin宽度,但要进行额外的预处理(例如归一化),以确保更好的灰度值可比性。在这种情况下,使用固定的bin数也是可能的,但计算出的特征仍可能受到图像中灰度值范围的影响,以及由于原始灰度值不太可比而产生的噪声。此外,无论采用什么类型的灰度值离散化方法,都必须采取措施确保良好的可比性,因为一阶特征主要使用原始灰度值(无离散化)。
最后,有一个关于每个bin宽度该选择多少的问题。目前文献中并没有具体的指导建议,而我们尝试选择一个bin宽度,以便最终的bin数量在30到130之间,这在文献中针对固定的bin数显示了很好的可重复性和性能[2]。这允许ROI中强度的不同范围,同时仍然保持纹理特征的信息性(和病变之间的可比性)。
#42-PyRadiomics是否遵循IBSI特征定义?
在很大程度上,是的。
PyRadiomics开发也参与了IBSI团队的标准化工作。然而,PyRadiomics和IBSI文档中定义的特征提取之间还是存在一些差异。这些差异出现在存在几种同样有效的替代方案的地方。在其中一些情况下,PyRadiomics选择了一种替代方案,而IBSI标准推荐另一种。为了保持 PyRadiomics开发的一致性,我们选择不改变PyRadiomics的实现,而是记录差异。
最值得注意的是灰度离散化(仅针对固定bin大小类型)和重采样的差异。这些差异不能仅通过自定义设置进行修正,而需要使用自定义函数替换:
分箱:在使用固定bin宽度进行灰度离散化时(又称IBSI:FBS,固定bin大小),如果设置了重新分割(最明显的是情况A和C),IBSI会计算从重新分割范围的最小值(如果是绝对重新分割)或最小强度(如果是σ重新分割)开始的等间距bin边缘。
在PyRadiomics中,使用固定bin宽度的灰度离散化始终使用从0开始的等间距bin边缘,确保最低灰度级被离散化到第一个bin。无论重新分割等情况如何。
重采样:
网格对齐:在IBSI中,通过对齐图像的中心来对齐重采样网格,而在PyRadiomics中,我们对齐原点体素的角。这可能导致稍微不同的插值结果,甚至重采样图像和ROI的大小略有不同,从而导致提取的特征值之间的差异。灰度值舍入:在IBSI中,他们认为,如果原始强度值来自某些较低精度的数据类型,重采样值(通常是64位的浮点数)应该重新采样到类似的分辨率。在IBSI幻影的情况下,重采样到最近的整数。PyRadiomics没有实现这一点,因为差异可能很小,因此增加复杂性而非增加提取值的意义。特别是考虑到在计算大多数(除一阶外)特征之前,灰度值都是离散化的。如果进行了某种归一化,则灰度值的意义也会发生变化。这里的差异是因为小的舍入差异可能导致体素被分配到不同一个bin,这可能会导致特征值结果的显著变化,特别是在较小的ROI中。
掩膜重采样:在IBSI中,还可以为掩膜重采样选择不同的插值器,并附加阈值以检索二值掩膜。这仅在掩膜限于零和非零(即1)值时有效。PyRadiomics还支持具有不同值标签的掩膜,允许通过指示不同的标签值从同一掩膜文件中提取不同的ROI。为防止任何不正确的重新分配,PyRadiomics强制掩膜重采样为最近邻。
接下来,还有一些差异可以通过自定义设置解决,本例仅适用于配置E,即同时执行绝对和σ重新分割。在PyRadiomics中,两种类型都已实现,但一次只能选择一种。为了模拟应用两种类型,我计算了重新分割后的绝对范围,并将其用作绝对重新分割范围:[-718, 400]
最后,在PyRadiomics和IBSI中,
一阶特征:峰度的计算存在差异。IBSI计算的是超额峰度,即峰度减3。PyRadiomics计算的是峰度,比IBSI高3。这个差异的原因是高斯分布的峰度为3。
所以总结起来,PyRadiomics结果和IBSI基准之间的差异原因,分别对应各种情况:
配置C:由于灰度离散化和重采样的差异 配置D:由于重采样的差异 配置E:由于重采样和重新分割的差异
#43-PyRadiomics支持哪些模态?2D?3D?彩色?
PyRadiomics并不是为某一特定模态而开发的。PyRadiomics可以处理多种模态,尽管不同模态之间的最佳设置可能有所不同。然而,对输入有一些限制:
灰度图像:PyRadiomics目前不支持从彩色图像或具有复杂值的图像中提取特征。在这些情况下,每个像素/体素具有多个值,而PyRadiomics不知道您如何组合这些值。可以选择一个颜色通道并将其用作输入:
import SimpleITK as sitk
from radiomics import featureextractor
extractor = featureextractor.RadiomicsFeatureExtractor(r’path/to/params.yml’)
ma_path = ‘path/to/maskfile.nrrd’
label = 1 # 如果您的掩膜中的ROI由其他值标识,请更改此处
color_channel = 0
im = sitk.ReadImage(r’path/to/image.jpg’)
selector = sitk.VectorIndexSelectionCastImageFilter()
selector.SetIndex(color_channel)
im = selector.Execute(im)
results = extractor.execute(im, ma_path, label=label)
文件格式:目前,PyRadiomics要求图像和掩膜输入是一个指向包含图像/掩膜的单个文件的字符串,或者是一个SimpleITK.Image对象(仅在交互模式下可能)。当使用DICOM时,需要先将单独的文件合并成一个体积,然后提取特征,方法是将其转换为NRRD或NIFTII,或者在python脚本中读取DICOM并从该脚本调用PyRadiomics。另请参阅PyRadiomics支持哪些输入图像和掩膜的文件类型?。
维度:PyRadiomics支持2D和3D输入图像,但请注意,特征类形状仅提取3D形状描述符,而shape2D仅提取2D形状描述符。如果您有一个3D体积,但是一个单切片分割,并希望结果包括2D形状描述符,请启用shape2D并设置force2D=True。这允许您从具有单切片分割的3D体积中提取2D形状特征(但在分割表示多个切片的体积分割时失败)。