IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数字图像处理:空间相关与卷积操作、滤波 -> 正文阅读

[人工智能]数字图像处理:空间相关与卷积操作、滤波

1、数字图像处理中相关和卷积的区别

个人理解:所谓相关算法,实际上是通过卷积计算来实现的。只是卷积操作要将核旋转180度。

在执行线性空间滤波时,经常会遇到两个概念相关和卷积,二者基本相似,在进行图像匹配是一个非常重要的方法。相关是滤波器模板移过图像并计算每个位置乘积之和的处理;卷积的机理相似,但滤波器首先要旋转180度。

相关的计算步骤:

(1)移动相关核的中心元素,使它位于输入图像待处理像素的正上方。

(2)将输入图像的像素值作为权重,乘以相关核。

(3)将上面各步得到的结果相加做为输出。

相关运算的用途:图象的匹配

卷积的计算步骤:

(1)卷积核绕自己的核心元素顺时针旋转180度。

(2)移动卷积核的中心元素,使它位于输入图像待处理像素的正上方。

(3)在旋转后的卷积核中,将输入图像的像素值作为权重相乘。

(4)第三步各结果的和做为该输入像素对应的输出像素。

超出边界时要补充像素,一般是添加0或者添加原始边界像素的值(方式有:补0填充、边界复制填充、镜像填充、块填充;(具体方式见下边界补充方法)),可以看出他们的主要区别在于卷积计算的时候,卷积核要先做旋转。而计算相关过程中不需要旋转相关核。

附加:

离散单位冲击:我们将包含单个1而其余全是0的函数成为离散单位冲击。

重要性质:一个函数与离散单位冲击相关,在冲击位置产生这个函数的一个翻转版本。

?2、线性滤波

滤波实际上是信号处理的一个概念,图像可以看成是一个二维信号,其中像素点灰度值的高低代表信号的强弱。高频指的是图像中变化剧烈的部分;低频图像中变化缓慢、平坦的部分。

根据图像高低频特性,设置高通和低通滤波器,高通滤波器可以检测图像中尖锐、变化明显的地方;低通滤波器可以让图形变的平滑(就是模糊了,看不清楚了),消除噪声干扰。

PS:低通滤波的平滑去噪,高通滤波的边缘检测。

图像滤波的函数方法:

线性滤波:方框滤波、均值滤波、高斯滤波。

非线性滤波:中值滤波、双边滤波。

线性滤波可以说是图像处理最基本的方法,它可以允许我们对图像进行处理,产生很多不同的效果。做法很简单。首先,我们有一个二维的滤波器矩阵(有个高大上的名字叫卷积核)和一个要处理的二维图像。然后,对于图像的每一个像素点,计算它的邻域像素和滤波器矩阵的对应元素的乘积,然后加起来,作为该像素位置的值。这样就完成了滤波过程。

??对图像和滤波矩阵进行逐个元素相乘再求和的操作就相当于将一个二维的函数移动到另一个二维函数的所有位置,这个操作就叫卷积或者协相关。卷积和协相关的差别是,卷积需要先对滤波矩阵进行180的翻转,但如果矩阵是对称的,那么两者就没有什么差别了。

?3、卷积的操作

3.1、卷积介绍

在图像处理中,卷积操作指的是使用一个卷积核(kernel)对图像中的每一个像素进行一些列操作。卷积核(算子)是用来做图像处理时的矩阵,图像处理时也称为掩膜,是于原图像做运算的参数。卷积核通常是一个方形的网格结构,该区域上的每一个方格都有一个权重值。

?Correlation(相关) 和 Convolution(卷积)可以说是图像处理最基本的操作,但却非常有用。这两个操作有两个非常关键的特点:它们是线性的,而且具有平移不变性shift-invariant。平移不变性指我们在图像的每个位置都执行相同的操作线性指这个操作是线性的,也就是我们用每个像素的邻域的线性组合来代替这个像素。这两个属性使得这个操作非常简单,因为线性操作是最简单的,然后在所有地方都做同样的操作就更简单了。

?2D卷积需要4个嵌套循环4-double loop,所以它并不快,除非我们使用很小的卷积核。这里一般使用3x3或者5x5。而且,对于滤波器,也有一定的规则要求:

  1. 滤波器的大小应该是奇数,这样它才有一个中心,例如3x3,5x5或者7x7。有中心了,也有了半径的称呼,例如5x5大小的核的半径就是2。
  2. 滤波器矩阵所有的元素之和应该要等于1,这是为了保证滤波前后图像的亮度保持不变。当然了,这不是硬性要求了。
  3. 如果滤波器矩阵所有元素之和大于1,那么滤波后的图像就会比原图像更亮,反之,如果小于1,那么得到的图像就会变暗。如果和为0,图像不会变黑,但也会非常暗。
  4. 对于滤波后的结构,可能会出现负数或者大于255的数值。对这种情况,我们将他们直接截断到0和255之间即可。对于负数,也可以取绝对值。

3.2、边界补充方法

上面的图片说明了图像的卷积操作,但是他也反映出一个问题,如上图,原始图片尺寸为7*7,卷积核的大小为3*3,当卷积核沿着图片滑动后只能滑动出一个5*5的图片出来,这就造成了卷积后的图片和卷积前的图片尺寸不一致,这显然不是我们想要的结果,所以为了避免这种情况,需要先对原始图片做边界填充处理。

原始图像:

?填充后的图像:

3.3、常用卷积核及其意义?

(1)一个没有任何作用的卷积核:

卷积核如下:

作用:将原像素中间像素值乘1,其余全部乘0,显然像素值不会发生任何变化。

?(2)平滑均值滤波:

卷积和如下:

?作用:该卷积核的作用在于取九个值的平均值代替中间像素值,所以起到的平滑的效果。

(3)高斯平滑:

卷积核如下:

?作用:高斯平滑水平和垂直方向呈现高斯分布,更突出了中心点在像素平滑后的权重,相比于均值滤波而言,有着更好的平滑效果。

(4)图像锐化 :

卷积核如下:

作用:该卷积利用的其实是图像中的边缘信息有着比周围像素更高的对比度,而经过卷积之后进一步增强了这种对比度,从而使图像显得棱角分明、画面清晰,起到锐化图像的效果。?

(5)梯度Prewitt:

卷积核如下:

?作用:梯度Prewitt卷积核与下边的Soble卷积核的选定是类似的,都是对水平边缘或垂直边缘有比较好的检测效果。

(6)Soble边缘检测:

卷积和如下:

作用:Soble与上述卷积核不同之处在于,Soble更强调了和边缘相邻的像素点对边缘的影响。

(7)梯度Laplacian

卷积核如下:

?作用:Laplacian也是一种锐化方法,同时也可以做边缘检测,而且边缘检测的应用中并不局限于水平方向或垂直方向,这是Laplacian与soble的区别。

3.4、卷积的计算

对图像处理而言,存在两大类的方法:空域处理和频域处理!空域处理是指直接对原始的像素空间进行计算,频率处理是指先对图像变换到频域,再做滤波等处理。?

3.4.1、空域计算-直接2D卷积?

直接2D卷积就是一开始说的那样,对于图像的每一个像素点,计算它的邻域像素和滤波器矩阵的对应元素的乘积,然后加起来,作为该像素位置的值。

?3.4.2、频域计算-快速傅里叶变换FFT卷积

?这个快速实现得益于卷积定理:时域上的卷积等于频域上的乘积。所以将我们的图像和滤波器通过算法变换到频域后,直接将他们相乘,然后再变换回时域(也就是图像的空域)就可以了。

?直接的实现也称为暴力实现brute force,因为它严格按照定义来实现,没有任何优化。当然了,在并行实现里面,它也是比较灵活的。另外,也存在一个优化版本,如果我们的kernel是separable可分的。

o表示矩阵逐元素相乘。那用什么方法将空域的图像和滤波器变换到频域了。

?参考:https://www.cnblogs.com/xiaojianliu/p/9075872.html

http://blog.sina.com.cn/s/blog_159aff7940102xbu5.html

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-23 10:47:03  更:2021-07-23 10:49:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/22 11:32:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码