OpenCV学习笔记(四)

科技2025-07-23 52

离散傅里叶变换原理：

把一张图片分解成正弦和余弦两个部分，空间域转换到频域

傅里叶变换的理论就是任意函数都可以表示成无数个正弦和余弦函数的和的部分。

空间域是实数，频域分解后是复数，因此变换后有实数图像，虚数图像(幅度图像，虚数图像)

逆傅里叶变化的时候必须需要幅度图像和虚数图像

在频域中，高频代表图像细节，纹理信息；低频代表图像的轮廓信息。

图像可以看做是一个定义为二维平面上的信号，该信号的幅值对应于像素的灰度（对于彩色图像则是RGB三个分量）

图像的频率又称为空间频率，它反映了图像的像素灰度在空间中变化的情况。

dft函数：对一维或二维浮点数组进行正向或反向离散傅里叶变化

void dft(InputArray src,OutputArray dst,int flags = 0,int nonezeroRows = 0)

一参:输入矩阵

二参:函数调用后的运算结果，其尺寸和类型取决于flags

三参:int类型的转换标识符，有默认值0：

#include "opencv2/core/core.hpp" #include "opencv2/imgproc/imgproc.hpp" #include "opencv2/highgui/highgui.hpp" #include <iostream> using namespace cv; int main( ) { //以灰度模式读取原始图像并显示 Mat srcImage = imread("1.jpg", 0); imshow("原始图像" , srcImage); //将输入图像延扩到最佳的尺寸，边界用0补充 int m = getOptimalDFTSize( srcImage.rows ); int n = getOptimalDFTSize( srcImage.cols ); //将添加的像素初始化为0. Mat padded; copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0)); //为傅立叶变换的结果(实部和虚部)分配存储空间。 //将planes数组组合合并成一个多通道的数组complexI Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)}; Mat complexI; merge(planes, 2, complexI); //进行就地离散傅里叶变换 dft(complexI, complexI); //将复数转换为幅值，即=> log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2)) split(complexI, planes); // 将多通道数组complexI分离成几个单通道数组，planes[0] = Re(DFT(I), planes[1] = Im(DFT(I)) magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude Mat magnitudeImage = planes[0]; //进行对数尺度(logarithmic scale)缩放 magnitudeImage += Scalar::all(1); log(magnitudeImage, magnitudeImage);//求自然对数 //剪切和重分布幅度图象限 //若有奇数行或奇数列，进行频谱裁剪 magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2)); //重新排列傅立叶图像中的象限，使得原点位于图像中心 int cx = magnitudeImage.cols/2; int cy = magnitudeImage.rows/2; Mat q0(magnitudeImage, Rect(0, 0, cx, cy)); // ROI区域的左上 Mat q1(magnitudeImage, Rect(cx, 0, cx, cy)); // ROI区域的右上 Mat q2(magnitudeImage, Rect(0, cy, cx, cy)); // ROI区域的左下 Mat q3(magnitudeImage, Rect(cx, cy, cx, cy)); // ROI区域的右下 //交换象限（左上与右下进行交换） Mat tmp; q0.copyTo(tmp); q3.copyTo(q0); tmp.copyTo(q3); //交换象限（右上与左下进行交换） q1.copyTo(tmp); q2.copyTo(q1); tmp.copyTo(q2); //归一化，用0到1之间的浮点值将矩阵变换为可视的图像格式 normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX); imshow("频谱幅值", magnitudeImage); waitKey(); return 0; }

程序效果图如下：

该程序涉及的API太多，下面分别描述其功能和作用：

getOptimalDFTSize：返回给定向量尺寸的傅里叶最优尺寸大小(为了提高离散傅里叶变换的运行速度)

copyMakeBorder：作用是扩充图像边界

copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));

一参二参，为源图像和扩充后的输出结果切size为扩充之后的size，

三参至六参，为四个方向扩充的像素数，这里的0,m - srcImage.rows, 0, n - srcImage.cols，不难理解

七参：边界类型八参：当边界类型取BORDER_CONSTANT，这个参数表示边界值

magnitude：用于计算二维矢量幅值

void magnitude(InputArray x,InputArray y,OutputArray magnitude)

log()：计算每个数组元素绝对值的自然对数

normalize：进行矩阵归一化

Processed: 0.056, SQL: 9