IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 图像特征与描述 -> 正文阅读

[人工智能]图像特征与描述

1.颜色特征

见1.1及2.1颜色特征提取

1.1 量化颜色直方图

适用于RGB、HSV等颜色空间。
操作:颜色空间量化,单位(bin)由单元中心代表,即统计落在量化单元上的像素数量
最常用的方法是将颜色空间的各个分量(维度)均匀地进行划分。

1.2 聚类颜色直方图

适用Lab等颜色空间。
操作:使用聚类算法对所有像素点颜色向量进行聚类,单元(bin)由聚类中心代表。
聚类算法则考虑到图像颜色特征再整个空间地分布情况,避免出现大量地bin中地像素数量非常稀疏的情况。

问题

当两幅图像的颜色直方图几乎相同,只是互相错开了一个bin时,如果采用L1距离或欧拉距离计算二者的相似度,会得到一个很小的值。为克服这个缺陷,需要考虑到相似但不相同的颜色之间的相似度:

  1. 次啊用二次式距离
  2. 对颜色直方图事先进行平滑过滤,即每个bin中的像素对于相邻的几个bin也由贡献。

2.几何特征:边缘

边缘:像素明显变化的区域,具有丰富的语义信息,可以用于物体识别、几何或视角变换。
边缘定义(数学上):像素值函数快速变化的区域 → \to 一阶导数的极值区域。
在这里插入图片描述
对于上图中的图3(一阶导数),边缘对应一阶导数极值。
在这里插入图片描述
边缘提取:先进行高斯去噪(高斯平滑),再使用一阶导数获取极值。(导数对噪声敏感)
在这里插入图片描述
在这里插入图片描述
对于斜方向的图片:求两个方向的高斯滤波一阶导
在这里插入图片描述
在这里插入图片描述

问题

边缘提取尺度问题:即不同标准差(高斯函数中的 σ \sigma σ)的滤波,不同的 σ \sigma σ可捕捉到不同尺度的边缘
在这里插入图片描述

3.基于特征点的特征描述子

从不同的距离,不同的方向、角度,不同的光照条件下观察一个物体时,物体的大小、形状、明暗都会有所不同。但是对于同一物体来说,即便环境条件不同,模型仍需要判断出它是同一个物体。

因此,理想的特征描述子应该具有以下性质:即在大小、方向、明暗不同的图像中,同一特征点应具有足够相似的描述子,称之为描述子的可复现性。

这些特征描述子也称之为特征点或关键点。
性质:
在这里插入图片描述
可用于:
在这里插入图片描述
最显著的特征:角点。角点检测

拉普拉斯梯度:
在这里插入图片描述
高斯拉普拉斯滤波:
G ( x , y , σ ) = 1 2 π σ 2 e ? ( x 2 + y 2 ) / 2 σ 2 G(x, y, \sigma) = \frac{1}{2 \pi \sigma^2} e^{- (x^2 + y^2) / 2 \sigma^2} G(x,y,σ)=2πσ21?e?(x2+y2)/2σ2
二阶导:
▽ 2 G = ? 2 ? x 2 G + ? 2 ? y 2 G = ? 2 σ 2 + x 2 + y 2 2 π σ 6 e ? ( x 2 + y 2 ) / 2 σ 2 \triangledown^2 G = \frac{\partial^2}{\partial x^2}G + \frac{\partial^2}{\partial y^2}G = \frac{- 2\sigma^2 + x^2 + y^2 }{2 \pi \sigma^6} e^{- (x^2 + y^2) / 2 \sigma^2 } 2G=?x2?2?G+?y2?2?G=2πσ6?2σ2+x2+y2?e?(x2+y2)/2σ2
在这里插入图片描述
在这里插入图片描述
基于尺度空间不变的特征:局部特征3.SIFT/SURF算算法

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-18 17:43:23  更:2022-04-18 17:48:08 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 10:33:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码