IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> SLIC算法 -> 正文阅读

[人工智能]SLIC算法

基础知识

在介绍SLIC之前,先来介绍以下Lab颜色空间的介绍。

Lab色彩模型是由亮度(L)要素和与有关色彩的a,b要素组成,L的值由0(黑色)到100(白色),a表示从洋红色至绿色的范围(a为负值表示绿色而正值表示品红),b表示从黄色至蓝色的范围(b为负值表示蓝色而正值表示黄色)。

Lab颜色空间的优点:
1)不像RGB和CMYK色彩空间,Lab颜色被设计来接近人类生理视觉。它致力于感知均匀性,它的L分量密切匹配人类亮度感知。因此可以被用来通过修改a和b分量的输出色阶来做精确的颜色平衡,或使用L分量来调整亮度对比。这些变换在RGB或CMYK种是困难的或不可能的。
2)色域宽广。它不仅包含了RGB、CMYK的所有色域,还能表现他们不能表现得色彩。人的肉眼能感知的色彩,都能通过Lab模型表现出来。另外,Lab色彩模型的绝妙之处还在于它弥补了RGB色彩模型色彩分布不均的不足,因为RGB模型在蓝色到绿色之间的过渡色彩过多,而在绿色到红色之间又缺少黄色和其他色彩。
3)Lab空间内的很多“颜色”超出了人类视觉的视域,因此纯粹是假想的;这些“颜色”不能在物理世界中再生。通过颜色管理软件,比如内置于图象编辑应用程序中的那些软件,可以选择最接近的色域内近似,在处理中变换亮度、彩度甚至色相。Dan Margulis称,在图象操作的多个步骤之间使用假想色是很有用的。

算法思想

SLIC算法时simple linear iterative cluster的简称,主要是将图像从RGB颜色空间转换到CIE-Lab颜色空间,对应每个像素的(L,a,b)颜色值和(x,y)坐标组成一个5维向量V[I,a,b,x,y],两个像素的相似性即可由他们的向量距离来度量,距离越大,相似性越小。

该算法与K-means聚类算法思路类似,首先生成K个种子点,然后在每个种子点的周围空间里搜索距离该种子点最近的若干像素,将他们归为与该种子点一类,直到所有像素点都归类完毕。然后计算这K个超像素里所有像素点的平均向量值,重新得到K个聚类中心,然后再以这K个中心去搜索其周围与其最为相似的若干像素,所有像素都归类完重新得到K个超像素,更新聚类中心,在此迭代,如此反复直到收敛。

具体算法步骤

在这里插入图片描述
1.初始化聚类中心:按照预先设定的超像素个数,在图像内均匀的分配聚类中心。如果图像有N个像素点,预分割为K个相同尺寸的超像素,那么每个超像素的大小为N/K,则相邻聚类中心的距离(步长)近似为 S = sqrt(N/K);
2.在聚类中心的n×n邻域内重新选择聚类中心(一般n取3)。具体方法为:计算该邻域内所有像素点的梯度值,将聚类中心移动到该邻域内梯度最小的地方。这样做的目的是为了避免中心点落在梯度较大1的轮廓边界上,以免影响后续聚类效果;
3.在每个聚类中心周围的邻域内为每个像素点分配类标签(即属于哪个聚类中心)。(期望的超像素尺寸为S×S,但其搜索范围为2S×2S);
4.计算搜索点到聚类中心的距离度量(包括颜色距离和空间距离);
在这里插入图片描述
其中,d c c c代表颜色距离,d s s s代表空间距离,N s s s是类内最大空间距离,定义N s s s=sqrt(N/K),适用于每个聚类,最大颜色距离N c c c随图片不同而不同,也随聚类不同而不同,所以一般取一个固定常数(取值范围[1-40],一般取10)代替。最终的距离测度D‘如下:
在这里插入图片描述
由于每个像素点都会被多个种子点搜索到,所以每个像素点都会有一个与周围种子点的距离,取最小值对应的种子点作为该像素点的聚类中心。
5.直到每个像素点聚类中心不再发生变化停止迭代(实践发现10次迭代绝大部分图片都可以得到较理想效果);
6.增强连通性:经过上述迭代优化可能会出现出现多连通、超像素尺寸过小,单个超像素被切割为多个不连续超像素等等问题,而这些情况可以通过增强连通性来解决。主要思路在于:新建一张标记表,表内元素均为-1,按照“Z”型走向(从左到右、从上到下顺序)将不连续的超像素、尺寸过小超像素重新分配给临近的超像素,遍历果的像素点分配给相应的标签,直到所有点遍历完毕为止。

SLIC主要优点

1)生成的超像素如同细胞一般紧凑整齐,邻域特征比较容易表达。这样基于像素的方法可以比较容易的改造为基于超像素的方法。
2)不仅可以分割彩色图,也可以兼容分割灰度图。
3)需要设置的参数非常少,默认情况下只需要设置一个预分割的超像素的数量。
4)相比其他的超像素分割方法,SLIC在运行速度、生成超像素的紧凑度、轮廓保持方面都比较理想。

以下是论文中的效果图
在这里插入图片描述

自己实现的效果图:
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-07 10:48:58  更:2021-09-07 10:51:09 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 15:28:18-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码