OpenCV环境搭建:
下载,安装,自行百度,这里只写些自己配置环境的经验
VS下视图选项,属性管理器
如下配置:
包含目录:
库目录:
链接文件(输入):
个人是创建项目搭建好环境后,把配置文件拿了出来:
好处是下次可以直接使用该配置文件所规定的环境,不用再次配置如上环境
OpenCV简介:
简单来说是C和C++编写的跨平台中高层API,主要用于图像处理类项目,开源,免费,不过里面有些商业算法,打包时慎用(一般接触不到)
OpenCv基本架构(建议熟悉了解):
calib3d:相机校准,三维重建
contrib:人脸识别,立体匹配,人工视网膜模型等
core:核心功能模块,包括一些基本数据结构,动态数据结构,绘图,数组操作函数,与OpenGL的互操作
imgproc:Image,Process,图像,处理模块
features2D:2D功能框架,各种特征检测,描述符操作等
flann:高维的近似近邻快速搜索算法库,包括聚类和快速近似最近邻搜索
gpu:运用GPU加速的计算机视觉模块
highgui:高层GUI加速的计算机视觉模块
legacy:用不到,废弃的代码库,保留下来,向下兼容用
ml:机器学习模块,基本是统计模型,和分类算法
nonfree:专利算法模块,慎用
objdetect:目标检测模块
ocl:运用OpenCL加速的计算机视觉组件模块
photo:图像修复和图像去噪
stitching:图像拼接模块
superres:超分辨率技术
ts:OpenCV测试相关代码,不用管
video:视频分析组件,包括运动估计,背景分离,对象跟踪等视频处理相关技术
Videostab:视频稳定相关的组件,不用管
Mat对象介绍:
顾名思义Mat对象,矩阵对象,在OpenCV中图像的存储基本上都是以矩阵的概念存储。
Mat对象包含两部分:矩阵头(包含信息有矩阵的大小,用于存储的方法,矩阵存储的地址等)
指向矩阵的指针(包含像素值的矩阵)
*像素值:颜色空间和数据类型
这种概念的好处是,可以有两个Mat对象指向同一个矩阵,毕竟矩阵的存储在内存中,无论是在时间或空间都是一件不容易的事。
Mat img = imread("E://hashiqi.jpg"); Mat b; img = b; Mat c(img);以上方式都是共享图像数据,一个对象对图片进行改动,保存,波及其他对象,即赋值运算符和复制构造函数 (构造函数)只复制头。
真正的把图像数据复制给另一个对象的方法是使用clone () 或copyTo () 函数将复制的图像的基础矩阵。
(函数原型中的InputArray/OutputArray都简单当做Mat对象)
Mat img = imread("E://hashiqi.jpg"); Mat b = img.clone(); Mat c; img.copyTo(c);在OpenCv中,通过图片生成Mat对象的方法是cv::imread 加载图像文件成为一个mat对象
imread(文件名,图像类型) IMREAD_UNCHANGED 加载原图(新版本中该标志已经废置) IMREAD_GRAYSCALE 把原图作为灰度图像加载进来 IMREAD_COLOR 把原图作为RGB图像加载进来
Mat img; img = imread("E://hashiqi.jpg");通过Mat对象显示图像的方法是cv::imshow
imshow("原图", img);通过Mat写入图像
通过Mat的 <<运算符,将矩阵写到一个图像文件,仅适用于二维矩阵。 数据结构参数命名定义:CV_ [每一项的位数] [有符号或无符号] [类型前缀] C [通道数]; 一般图像结构参数:CV_8UC1,CV_8UC2,CV_8UC3, CV_8UC4(Unsigned 8bits);
Mat M(2,2, CV_8UC3, Scalar(0,0,255));Scalar 是四个元素短向量。指定此和可以初始化所有矩阵点与自定义的值。
Mat::eyes(单位矩阵),Mat::ones(全1矩阵),Mat::zeros(零矩阵)
一些常用的数据类型:
Point2f,Point3f,顾名思义二维点,三维点,p(x,y),p3(x,y,z)
定义和输出基于Mat的std::vector,正常的变长数组在opencv中可以这样用,Mat(v);
关于图像的基本知识
灰度图像:黑,白 彩色图像:RGB,编写代码的一种颜色的透明度有时第四个元素: 添加 alpha (A)。
图像的色彩空间常用的有BGR和HSV
BGR:顾名思义,三基色blue,green,red,与人眼成像元色一致,OpenCV中大多数图像的色彩空间都应该是BGR
HSV:HSV(Hue, Saturation, Value)是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。色调H用角度度量,取值范围为0°~360°,S表示饱和度,也就是色彩的深浅度(0-100%) ,V表示色彩的亮度(0-100%) 。
H:色相(颜色)S:饱和度(类似于淡红,普通红,深红) V:亮度(明度)
下面是BGR图像色彩空间转HSV色彩空间,并在控制台打印出像素的具体参数
using namespace std; using namespace cv; //回调函数的函数声明 void on_mouse(int EVENT, int x, int y, int flags, void* userdata); int main(int argc, char** argv) { Mat src, hsv; //此处更改图片地址 src = imread("E://hashiqi.jpg"); namedWindow("display"); //捕捉指定窗口的鼠标信息 setMouseCallback("display", on_mouse, &src); while (1) { imshow("display", src); //waitKey,等待键盘输入,防止图片一闪而过 waitKey(40); } } //void*可赋值成任何类型的指针 //通常情况下不要解指针,毕竟void* void on_mouse(int EVENT, int x, int y, int flags, void* userdata) { Mat rgb, hsv; rgb = *(Mat*)userdata; Mat temp; cvtColor(*(Mat*)userdata, hsv, COLOR_BGR2HSV); Point p(x, y); switch (EVENT) { //case 鼠标点击 case EVENT_LBUTTONDOWN: { printf("b=%d\t", rgb.at<Vec3b>(p)[0]); printf("g=%d\t", rgb.at<Vec3b>(p)[1]); printf("r=%d\n", rgb.at<Vec3b>(p)[2]); printf("H=%d\t", hsv.at<Vec3b>(p)[0]); printf("S=%d\t", hsv.at<Vec3b>(p)[1]); printf("V=%d\n", hsv.at<Vec3b>(p)[2]); circle(rgb, p, 2, Scalar(255), 3); } break; } }(备注用cv_BGR2HSV要加type头文件,建议使用COLOR_BGR2HSV)
HSV参数值变动对图像的影响:
#include<opencv2/core.hpp> #include<opencv2/highgui.hpp> #include<opencv2/imgproc.hpp> using namespace cv; #include<iostream> #include<string> using namespace std; //输入图像 Mat img; //灰度值归一化 Mat bgr; //HSV图像 Mat hsv; //色相 int hmin = 0; int hmin_Max = 360; int hmax = 360; int hmax_Max = 360; //饱和度 int smin = 0; int smin_Max = 255; int smax = 255; int smax_Max = 255; //亮度 int vmin = 106; int vmin_Max = 255; int vmax = 250; int vmax_Max = 255; //显示原图的窗口 string windowName = "src"; //输出图像的显示窗口 string dstName = "dst"; //输出图像 Mat dst; //回调函数 void callBack(int, void*) { //输出图像分配内存 dst = Mat::zeros(img.size(), CV_32FC3); //掩码 Mat mask; //inRange函数,在阈值为255(白),不在阈值为0(黑) inRange(hsv, Scalar(hmin, smin / float(smin_Max), vmin / float(vmin_Max)), Scalar(hmax, smax / float(smax_Max), vmax / float(vmax_Max)), mask); //只保留 for (int r = 0; r < bgr.rows; r++) { for (int c = 0; c < bgr.cols; c++) { if (mask.at<uchar>(r, c) == 255) { dst.at<Vec3f>(r, c) = bgr.at<Vec3f>(r, c); } } } //输出图像 imshow(dstName, dst); //保存图像 dst.convertTo(dst, CV_8UC3, 255.0, 0); imwrite("HSV_inRange.jpg", dst); } int main(int argc, char* argv[]) { //输入图像 img = imread("E://hashiqi.jpg", IMREAD_COLOR); if (!img.data || img.channels() != 3) return -1; imshow(windowName, img); //彩色图像的灰度值归一化 img.convertTo(bgr, CV_32FC3, 1.0 / 255, 0); //颜色空间转换 cvtColor(bgr, hsv, COLOR_BGR2HSV); //定义输出图像的显示窗口 namedWindow(dstName, WINDOW_GUI_EXPANDED); //调节色相 H createTrackbar("hmin", dstName, &hmin, hmin_Max, callBack); createTrackbar("hmax", dstName, &hmax, hmax_Max, callBack); //调节饱和度 S createTrackbar("smin", dstName, &smin, smin_Max, callBack); createTrackbar("smax", dstName, &smax, smax_Max, callBack); //调节亮度 V createTrackbar("vmin", dstName, &vmin, vmin_Max, callBack); createTrackbar("vmax", dstName, &vmax, vmax_Max, callBack); callBack(0, 0); waitKey(0); return 0; } /* * createTrackbar()函数的函数原型为: CV_EXPORTS int createTrackbar(const String& trackbarname, const String& winname,int* value, int count,TrackbarCallback onChange = 0, void* userdata = 0); trackbarname:这个参数用来给这个滚动条取一个名字; winname:这个参数用来指定你要吧这个滚动条用到那个窗口上; value:这个参数用来设置滑块初始值位置,同时记录滑块以后的位置; count:这个参数用来指定滚动条可以滚动的最大值; onChange:这个参数可以理解为一个函数类型的变量(当然这样说感觉有点怪),用来接收回调函数函数名的,默认值为0; userdata:这个变量这个参数是用户传给回调函数的数据,用来处理轨迹条事件,默认值为0。 */