?Keras 库中的一个模块,用于处理和增强图像数据,它提供了一些实用的函数,如图像的加载、预处理、增强等。
用于加载图像文件,并返回一个 NumPy 数组表示该图像
from keras.preprocessing.image import load_img,load_img,array_to_img
import numpy as np
#从指定路径加载图像,并将其调整为指定的大小(默认为 (224, 224))
img = image.load_img('test.jpg', target_size=(224, 224))
将图像转换为 NumPy 数组。
from keras.preprocessing.image import load_img,load_img,array_to_img
import numpy as np
# 加载图像并调整大小
img = image.load_img('example.jpg', target_size=(224, 224))
# 将 PIL 图像转换为 numpy 数组
x = image.img_to_array(img)
将 numpy 数组或 PIL 图像转换为 PIL 图像。
from keras.preprocessing.image import load_img,load_img,array_to_img
# 加载图像并调整大小
img = load_img('example.jpg', target_size=(224, 224))
# 将 PIL 图像转换为 numpy 数组
x = img_to_array(img)
# 将 numpy 数组转换为 PIL 图像
y = array_to_img(x)
用于数据增强的类,可以对图像进行旋转、缩放、平移、翻转等操作。
# 导入Keras的ImageDataGenerator模块,用于数据增强
from keras.preprocessing.image import ImageDataGenerator
# 创建一个ImageDataGenerator对象,设置各种数据增强参数
datagen = ImageDataGenerator(
rotation_range=40, # 随机旋转的角度范围
width_shift_range=0.2, # 水平平移的范围
height_shift_range=0.2, # 垂直平移的范围
shear_range=0.2, # 剪切强度
zoom_range=0.2, # 随机缩放的范围
horizontal_flip=True, # 是否进行水平翻转
fill_mode='nearest' # 填充新创建像素的方法
)
#使用flow_from_directory方法从指定的目录中读取图像数据
#并将其传递给ImageDataGenerator对象进行处理
train_generator = datagen.flow_from_directory(
'path/train/data', #训练数据的目录
target_size=(150, 150), #将所有图像调整为150x150大小
batch_size=32, #每个批次包含32个图像
class_mode='binary' #对于多分类问题使用 'categorical',对于二元分类问题使用 'binary',对于无标签问题使用 None
)
#使用生成器对象来训练模型
model.fit_generator(
train_generator,
steps_per_epoch=2000, # 每个epoch需要遍历的批次数
epochs=50 # 训练的总轮数
)
注:
flow_from_directory
方法中的target_size
参数需要与模型输入层的大小相匹from keras.preprocessing.image import ImageDataGenerator,load_img, img_to_array
# 创建一个ImageDataGenerator实例
datagen = ImageDataGenerator(
rotation_range=40, # 随机旋转的角度范围
width_shift_range=0.2, # 水平平移的范围
height_shift_range=0.2, # 垂直平移的范围
shear_range=0.2, # 剪切强度
zoom_range=0.2, # 随机缩放的范围
horizontal_flip=True, # 是否进行水平翻转
fill_mode='nearest' # 填充新创建像素的方法
)
# 加载图像数据
img = load_img('input.jpg')
x = img_to_array(img) # 将其转换为NumPy数组的形状(3, 150, 150)
x = x.reshape((1,) + x.shape) # 将其重新整形为(1, 3, 150, 150)
# 使用ImageDataGenerator生成增强后的图像
i = 0
for batch in datagen.flow(x, batch_size=1, save_to_dir='preview', save_prefix='img', save_format='jpeg'):
i += 1
if i > 20:
break #增强图像数量20张
注:
save_to_dir:
指定保存生成的图像的目录。如果该目录不存在,Keras将自动创建它。save_prefix:
指定保存的图像的前缀。每个生成的图像都将以其前缀命名。save_format:
指定保存的图像的格式。默认情况下,Keras将保存为JPEG格式的图像