python数字图像处理基础(七)——直方图均衡化、傅里叶变换

发布时间:2024年01月18日

直方图均衡化

均衡化原理

图像均衡化是一种基本的图像处理技术,通过更新图像直方图的像素强度分布来调整图像的全局对比度。这样做可以使低对比度的区域在输出图像中获得更高的对比度。

简单理解:改变图像对比度,让色彩更丰富,灰度值直方图:瘦高 -> 均衡

本质上,直方图均衡化的工作原理是:

  • 1.计算图像像素强度的直方图
  • 2.均匀展开并分布最频繁的像素值(即直方图中计数最大的像素值)
  • 3.给出累积分布函数(CDF)的线性趋势

在这里插入图片描述

注意到以上直方图有许多峰值,这表明有很多像素被归入到这些各自的bin中。使用直方图均衡化,我们的目标是将这些像素分散到没有太多像素的bin中。

均衡化效果

在这里插入图片描述

注意输入图像的对比度是如何显著提高的,但代价是也提高了输入图像中的噪声的对比度。

这就提出了一个问题:是否有可能在不增加噪声的同时提高图像对比度?
答案是“是的”,你只需要应用自适应直方图均衡化

通过自适应直方图均衡化,我们将输入图像划分为M × N网格。然后我们对网格中的每个单元进行均衡处理,从而获得更高质量的输出图像:

在这里插入图片描述

标准直方图均衡化

OpenCV 包括通过以下两个函数实现基本直方图均衡和自适应直方图均衡:

cv2.equalizeHist
cv2.createCLAHE

应用cv2.equalizeHist()函数非常简单,只需将图像转换为灰度,然后调用cv2.equalizeHist即可:

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
equalized = cv2.equalizeHist(gray)

自适应直方图均衡化

实现自适应直方图均衡化要求:

1.将输入图像转换为灰度/从中提取单个通道
2.使用cv2.createCLAHE实例化CLAHE算法
3.在CLAHE对象上调用.apply()方法来应用直方图均衡化
这比听起来容易得多,只需要几行代码:

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8, 8))
equalized = clahe.apply(gray)

注意,我们为cv2.createCLAHE提供了两个参数:

  • clipLimit:这是对比度限制的阈值
  • tileGridSize:将输入图像划分为M × N块,然后对每个局部块应用直方图均衡化

傅里叶变换

原理

傅里叶变换常用来分析各种滤波器的特性。可以是用2D离散傅里叶变换分析图像的频域特性。

(个人理解,在图像问题当中,频域是指图像的灰度变化,也就是灰度图像的梯度值,这个和轮廓的原理差不多,灰度值变化剧烈的叫做高频分量,例如边界和噪声。灰度值变化缓慢的称谓低频分量)

实现2D离散傅里叶变换(DFT)的的算法叫做快速傅里叶变换(FFT)。

对图像进行X方向和Y方向的傅里叶变换,会得到图像的频域表示图。

直观理解,一个正弦信号,如果幅度变换很快,可以称之为高频信号,如果变换慢,可以称之为低频信号。在图像中,灰度值变化快的位置,可以称之为高频分量(只变化快而不是次数多),灰度值变化慢的称之为低频分量

图像使用使用二维离散傅里叶变换后得到一个复数矩阵,叫做图像的频谱图。

低通滤波器:只保留低频,会使得图像模糊

高通滤波器:只保留高频,会使得图像细节增强

  • opencv中主要就是从cv2.dftt()cv2.idft(),输入图像需要先转换成np.float32格式:

    img = cv2.imread(‘lena.jpg’, 0)

    img_ float32 = np.float32(img)

    dft = cv2.dft(img_float32, flags = cv2.DFT_COMPLEX_OUTPUT)

  • 得到的结果中频率为0的部分会在左上角,通常要转换到中心位置(故转换后的图像从中心向四周频率增高),可以通过shift变换来实现:

    dft_shift = np.fft.fftshift(dft)

  • cv2.dft()返回的结果是复数矩阵,即双通道的(实部,虚部),通常还需要转换成图像格式才能展示(0,255)

    magnitude_spectrum = 20*np.log(cv2.magnitude(dft_shift[:, :, 0],dft_shift[:, :, 1]))

img = cv2.imread('33.jpg',0)  # 读图
dft = cv2.dft(np.float32(img),flags = cv2.DFT_COMPLEX_OUTPUT)  # 傅里叶变换
dft_shift = np.fft.fftshift(dft)  # 平移到中心,结果为双通道(实部,虚部)
magnitude_spectrum = 20*np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))  # 转化为频谱图

理解:通过傅里叶变换,将图像转化为频谱图,而低通滤波和高通滤波则是傅里叶变换的逆变换,即通过对频谱图进行一些操作(保留低频/保留高频),从而达到改变原始图像的效果。

低通滤波

作用:将图像变得平滑,同时也就看起来比较模糊。

做法:利用掩码,把中心部分频率低的保留下来

import numpy as np
import cv2
from matplotlib import pyplot as plt

img = cv2.imread('./image/img1.jpg', 0)

img_float32 = np.float32(img)

dft = cv2.dft(img_float32, flags= cv2.DFT_COMPLEX_OUTPUT)
dft_shift = np.fft.fftshift(dft)

rows, cols = img.shape  # 横纵坐标
crow, ccol = int(rows/2), int(cols/2)  # 找到中心位置

# 低通滤波制作蒙板
mask = np.zeros((rows, cols, 2), np.uint8)  # 初始化全部像素点数值置为0
mask[crow-30:crow+30, ccol-30:ccol+30] = 1  # 相当于只有中心位置60*60像素点是1,其余全为0

# IDFT傅里叶逆变换 即把dft后得到的按频率分布的奇奇怪怪的图(称为频谱图)变为原来imread进来的图
fshift = dft_shift*mask  # 将掩膜和得到的结果结合,即只有中心60*60保留
f_ishift = np.fft.fftshift(fshift)  # 做逆变换,当然要把原来fft左上角移到中间的再移回左上角ifft
img_back = cv2.idft(f_ishift)  # 逆变换,频谱图还原为原图,但还不能看,因为结果是双通道(实部,虚部)
img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])  # 套公式处理,让图像可看

plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(img_back, cmap='gray')
plt.title('Result'), plt.xticks([]), plt.yticks([])

plt.show()

高通滤波

作用:增强边缘,非边缘部分被过滤

做法:使用一个60×60的矩形窗口进行蒙板操作,去除低频分量,使用函数np.fft.ifftshift将图像中心平移回左上角,然后使用函数 np.ifft2()进行FFT逆变换,将得到的复数结果取绝对值。(DFT的逆变换)

与低通滤波唯一的区别就在蒙版的制作

import numpy as np
import cv2
from matplotlib import pyplot as plt

img = cv2.imread('./image/img1.jpg', 0)

img_float32 = np.float32(img)

dft = cv2.dft(img_float32, flags= cv2.DFT_COMPLEX_OUTPUT)
dft_shift = np.fft.fftshift(dft)

rows, cols = img.shape  # 横纵坐标
crow, ccol = int(rows/2), int(cols/2)  # 找到中心位置

# 高通滤波制作蒙板
mask = np.ones((rows, cols, 2), np.uint8)  # 初始化全部像素点数值置为1
mask[crow-30:crow+30, ccol-30:ccol+30] = 0  # 相当于只有中心位置60*60像素点是0,其余全为1

# IDFT傅里叶逆变换 即把dft后得到的按频率分布的奇奇怪怪的图变为原来imread进来的图
fshift = dft_shift*mask  # 将掩膜和得到的结果结合,即只有中心60*60保留
f_ishift = np.fft.fftshift(fshift)  # 做逆变换,当然要把原来fft左上角移到中间的再移回左上角ifft
img_back = cv2.idft(f_ishift)  # 逆变换,模糊频率图还原为原图,但还不能看,因为结果是双通道(实部,虚部)
img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])  # 套公式处理,让图像可看

plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(img_back, cmap='gray')
plt.title('Result'), plt.xticks([]), plt.yticks([])

plt.show()

思想:将图像通过傅里叶变换映射到频域中进行操作,往往简单高效,最后再逆变换转化回来就好


文章来源:https://blog.csdn.net/SavEMyselF1/article/details/135662919
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。