这是一篇对现有的水果收获机器人抓取系统的分析的论文。
论文的主要贡献:证明这个水果抓取系统是可行的,而且对水果坐标的计算误差较小,具备较强的水果识别和定位能力。
在图像预处理中有几个术语, 中值滤波:这是一种数字图像处理方法,原理是模板中心对准处理像素,对模板下的对应像素进行灰度值排序,将中值赋给当前像素。 阀值分割:图像分割的一种方法,其中有迭代法,最大熵等 寻找轮廓:在图像或者视频分析的时候,物体检测通常要将他的轮廓提取出来, 步骤一般是:图像灰度化-图像二值化处理-寻找轮廓
其中的计算表达式昨天在周志华机器学习那本书的线性模型那一章刚刚看过,是线性属性组合而成的函数。 论文中说卷积神经网络是选取一固定大小的卷积核来对整个图形进行输入处理,提取整个图像的特征,经卷积计算后获取图像的该类特征。 那什么是卷积核?卷积核是训练出来的,借鉴了加权求和。 本质是找出图片中与自己相似的部分,关于卷积核的特点和格式自行百度。
池化层的主要作用是在提取图像特征的过程中,减少冗余度,提供深度学习模型的泛化能力。唯一目的是减小图像的空间大小,保持纵深不变,论文中使用的是最大池化。
这个图中将CNN神经元分为三个维度。 假设输入图像为W1H1D1,滤波器的个数和大小分别 K和F。边界填充是P,计算步长是S,则经过卷积计算的输出为在这里插入图片描述
1.建立卷积神经网络模型,用于提取提取图像特征 2.采用选择搜索的方法,对图像中区域进行特征提取 3。训练SVM分类器,对提取到的特征进行分类 4.使用回归器对目标区域进行修正 我们知道在基于人员在识别的综合管廊智慧监控系统是用是softmax进行分类的。SNM分类和softmax分类的区别是: SVM得到的是得分值,并不是确定的概率值,可以通过sigmid函数把任意输入值的得分值转化为概率值,使用的最大边界损失。更加局部目标化。 softmax 使用交叉熵损失。 在卷积神经网络上的分类 1.线性分类器 也就是 上面提到的那个线性函数F(xi,W,b)=Wxi+b。根据这个函数可以得到计算分值,进而进行分类。 其中解释损失函数和正则的什么的,用到了线性代数,以后用到之后会更加深入理解。。
使用RCNN区域目标检测方法精确度更高。
建立相机成像模型,实现坐标转换,下图包含世界,相机,图像,像素四个坐标系。 这里用到了投影原理,的大了相机和图像之间的线性代数的坐标之间的关系,这里就暂且跳过。
一套基于卷积神经网络的目标检测算法;接着,利用图像处理技术实现了对目标物体定位的功能,可以引导水果收获机器人完成对目标水果的采摘。实验结果表明:水果收获机器人抓取系统对水果坐标的计算误差较小。
