OpenCV学习笔记（一）

科技2022-08-10 124

OpenCV环境搭建：

下载，安装，自行百度，这里只写些自己配置环境的经验

VS下视图选项，属性管理器

如下配置：

包含目录：

库目录：

链接文件（输入）：

个人是创建项目搭建好环境后，把配置文件拿了出来：

好处是下次可以直接使用该配置文件所规定的环境，不用再次配置如上环境

OpenCV简介：

简单来说是C和C++编写的跨平台中高层API，主要用于图像处理类项目，开源，免费，不过里面有些商业算法，打包时慎用（一般接触不到）

OpenCv基本架构(建议熟悉了解)：

calib3d:相机校准，三维重建

contrib：人脸识别，立体匹配，人工视网膜模型等

core：核心功能模块，包括一些基本数据结构，动态数据结构，绘图，数组操作函数，与OpenGL的互操作

imgproc：Image，Process，图像，处理模块

features2D：2D功能框架，各种特征检测，描述符操作等

flann：高维的近似近邻快速搜索算法库，包括聚类和快速近似最近邻搜索

gpu：运用GPU加速的计算机视觉模块

highgui：高层GUI加速的计算机视觉模块

legacy：用不到，废弃的代码库，保留下来，向下兼容用

ml：机器学习模块，基本是统计模型，和分类算法

nonfree：专利算法模块，慎用

objdetect：目标检测模块

ocl：运用OpenCL加速的计算机视觉组件模块

photo：图像修复和图像去噪

stitching：图像拼接模块

superres：超分辨率技术

ts：OpenCV测试相关代码，不用管

video：视频分析组件，包括运动估计，背景分离，对象跟踪等视频处理相关技术

Videostab：视频稳定相关的组件，不用管

Mat对象介绍：

顾名思义Mat对象，矩阵对象，在OpenCV中图像的存储基本上都是以矩阵的概念存储。

Mat对象包含两部分：矩阵头（包含信息有矩阵的大小，用于存储的方法，矩阵存储的地址等）

指向矩阵的指针（包含像素值的矩阵）

*像素值：颜色空间和数据类型

这种概念的好处是，可以有两个Mat对象指向同一个矩阵，毕竟矩阵的存储在内存中，无论是在时间或空间都是一件不容易的事。

Mat img = imread("E://hashiqi.jpg"); Mat b; img = b; Mat c(img);

以上方式都是共享图像数据，一个对象对图片进行改动，保存，波及其他对象，即赋值运算符和复制构造函数（构造函数）只复制头。

真正的把图像数据复制给另一个对象的方法是使用clone () 或copyTo () 函数将复制的图像的基础矩阵。

（函数原型中的InputArray/OutputArray都简单当做Mat对象）

Mat img = imread("E://hashiqi.jpg"); Mat b = img.clone(); Mat c; img.copyTo(c);

在OpenCv中，通过图片生成Mat对象的方法是cv::imread 加载图像文件成为一个mat对象

imread（文件名，图像类型） IMREAD_UNCHANGED 加载原图(新版本中该标志已经废置) IMREAD_GRAYSCALE 把原图作为灰度图像加载进来 IMREAD_COLOR 把原图作为RGB图像加载进来

Mat img; img = imread("E://hashiqi.jpg");

通过Mat对象显示图像的方法是cv::imshow

imshow("原图", img);

通过Mat写入图像

通过Mat的 <<运算符，将矩阵写到一个图像文件，仅适用于二维矩阵。数据结构参数命名定义：CV_ [每一项的位数] [有符号或无符号] [类型前缀] C [通道数]；一般图像结构参数：CV_8UC1，CV_8UC2，CV_8UC3, CV_8UC4（Unsigned 8bits）；

Mat M(2,2, CV_8UC3, Scalar(0,0,255));

Scalar 是四个元素短向量。指定此和可以初始化所有矩阵点与自定义的值。

Mat::eyes(单位矩阵)，Mat::ones(全1矩阵)，Mat::zeros(零矩阵)

一些常用的数据类型：

Point2f,Point3f,顾名思义二维点，三维点，p(x,y),p3(x,y,z)

定义和输出基于Mat的std::vector，正常的变长数组在opencv中可以这样用，Mat(v);

关于图像的基本知识

灰度图像：黑，白彩色图像：RGB，编写代码的一种颜色的透明度有时第四个元素：添加 alpha (A)。

图像的色彩空间常用的有BGR和HSV

BGR：顾名思义，三基色blue，green，red，与人眼成像元色一致，OpenCV中大多数图像的色彩空间都应该是BGR

HSV：HSV(Hue, Saturation, Value)是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。色调H用角度度量，取值范围为0°～360°,S表示饱和度，也就是色彩的深浅度(0-100%) ,V表示色彩的亮度(0-100%) 。

H:色相（颜色）S:饱和度（类似于淡红，普通红，深红） V:亮度（明度）

下面是BGR图像色彩空间转HSV色彩空间，并在控制台打印出像素的具体参数

using namespace std; using namespace cv; //回调函数的函数声明 void on_mouse(int EVENT, int x, int y, int flags, void* userdata); int main(int argc, char** argv) { Mat src, hsv; //此处更改图片地址 src = imread("E://hashiqi.jpg"); namedWindow("display"); //捕捉指定窗口的鼠标信息 setMouseCallback("display", on_mouse, &src); while (1) { imshow("display", src); //waitKey,等待键盘输入，防止图片一闪而过 waitKey(40); } } //void*可赋值成任何类型的指针 //通常情况下不要解指针，毕竟void* void on_mouse(int EVENT, int x, int y, int flags, void* userdata) { Mat rgb, hsv; rgb = *(Mat*)userdata; Mat temp; cvtColor(*(Mat*)userdata, hsv, COLOR_BGR2HSV); Point p(x, y); switch (EVENT) { //case 鼠标点击 case EVENT_LBUTTONDOWN: { printf("b=%d\t", rgb.at<Vec3b>(p)[0]); printf("g=%d\t", rgb.at<Vec3b>(p)[1]); printf("r=%d\n", rgb.at<Vec3b>(p)[2]); printf("H=%d\t", hsv.at<Vec3b>(p)[0]); printf("S=%d\t", hsv.at<Vec3b>(p)[1]); printf("V=%d\n", hsv.at<Vec3b>(p)[2]); circle(rgb, p, 2, Scalar(255), 3); } break; } }

（备注用cv_BGR2HSV要加type头文件，建议使用COLOR_BGR2HSV）

HSV参数值变动对图像的影响：

#include<opencv2/core.hpp> #include<opencv2/highgui.hpp> #include<opencv2/imgproc.hpp> using namespace cv; #include<iostream> #include<string> using namespace std; //输入图像 Mat img; //灰度值归一化 Mat bgr; //HSV图像 Mat hsv; //色相 int hmin = 0; int hmin_Max = 360; int hmax = 360; int hmax_Max = 360; //饱和度 int smin = 0; int smin_Max = 255; int smax = 255; int smax_Max = 255; //亮度 int vmin = 106; int vmin_Max = 255; int vmax = 250; int vmax_Max = 255; //显示原图的窗口 string windowName = "src"; //输出图像的显示窗口 string dstName = "dst"; //输出图像 Mat dst; //回调函数 void callBack(int, void*) { //输出图像分配内存 dst = Mat::zeros(img.size(), CV_32FC3); //掩码 Mat mask; //inRange函数，在阈值为255(白),不在阈值为0(黑) inRange(hsv, Scalar(hmin, smin / float(smin_Max), vmin / float(vmin_Max)), Scalar(hmax, smax / float(smax_Max), vmax / float(vmax_Max)), mask); //只保留 for (int r = 0; r < bgr.rows; r++) { for (int c = 0; c < bgr.cols; c++) { if (mask.at<uchar>(r, c) == 255) { dst.at<Vec3f>(r, c) = bgr.at<Vec3f>(r, c); } } } //输出图像 imshow(dstName, dst); //保存图像 dst.convertTo(dst, CV_8UC3, 255.0, 0); imwrite("HSV_inRange.jpg", dst); } int main(int argc, char* argv[]) { //输入图像 img = imread("E://hashiqi.jpg", IMREAD_COLOR); if (!img.data || img.channels() != 3) return -1; imshow(windowName, img); //彩色图像的灰度值归一化 img.convertTo(bgr, CV_32FC3, 1.0 / 255, 0); //颜色空间转换 cvtColor(bgr, hsv, COLOR_BGR2HSV); //定义输出图像的显示窗口 namedWindow(dstName, WINDOW_GUI_EXPANDED); //调节色相 H createTrackbar("hmin", dstName, &hmin, hmin_Max, callBack); createTrackbar("hmax", dstName, &hmax, hmax_Max, callBack); //调节饱和度 S createTrackbar("smin", dstName, &smin, smin_Max, callBack); createTrackbar("smax", dstName, &smax, smax_Max, callBack); //调节亮度 V createTrackbar("vmin", dstName, &vmin, vmin_Max, callBack); createTrackbar("vmax", dstName, &vmax, vmax_Max, callBack); callBack(0, 0); waitKey(0); return 0; } /* * createTrackbar（）函数的函数原型为： CV_EXPORTS int createTrackbar(const String& trackbarname, const String& winname，int* value, int count,TrackbarCallback onChange = 0, void* userdata = 0); trackbarname：这个参数用来给这个滚动条取一个名字； winname：这个参数用来指定你要吧这个滚动条用到那个窗口上； value：这个参数用来设置滑块初始值位置，同时记录滑块以后的位置； count：这个参数用来指定滚动条可以滚动的最大值； onChange：这个参数可以理解为一个函数类型的变量（当然这样说感觉有点怪），用来接收回调函数函数名的，默认值为0； userdata：这个变量这个参数是用户传给回调函数的数据，用来处理轨迹条事件，默认值为0。 */

Processed: 0.019, SQL: 9