IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 基于聚类的图像分割-Python -> 正文阅读

[人工智能]基于聚类的图像分割-Python

作者:recommend-item-box type_download clearfix

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

cd8230f4b55743a5fa43a08cab00895c.png


了解图像分割

当我们在做一个图像分类任务时,首先我们会想从图像中捕获感兴趣的区域,然后再将其输入到模型中。让我们尝试一种称为基于聚类的图像分割技术,它会帮助我们在一定程度上提高模型性能,让我们看看它是什么以及一些进行聚类分割的示例代码。


什么是图像分割?

想象一下我们要过马路,过马路之前我们会做什么?

首先,我们会看道路两旁,以确定接近的车辆等环境对象,然后我们会对接近的车辆的速度做出一些快速的估计,并决定何时以及如何过马路。所有这些都发生在很短的时间内,非常很的神奇。

  1. 我们的大脑捕捉道路两侧的图像

  2. 它检测道路上的车辆和其他物体==物体检测

  3. 它还确定了它检测到的每个对象的形状 == 图像分割

通过确定不同物体的形状,我们的大脑能够在同一张快照中检测到多个物体,这是多么神奇啊。

让我们进一步了解,假设我们有我们的图像分类模型,它能够以 95% 上的准确率对苹果和橙子进行分类。当我们输入一幅同时包含苹果和橙子的图像时,预测精度会下降。随着图像中对象数量的增加,分类模型的性能会下降,这就是目标定位发挥作用的地方。

在我们检测图像中的对象并对其进行分类之前,模型需要了解图像中的内容,这就是图像分割的帮助所在。它为图像中的对象创建一个像素级的蒙版,这有助于模型更精细地理解对象的形状及其在图像中的位置。

cb27b29c33f6c38626e1c514b5f90733.png

目标检测 VS 图像分割?


分割的类型有哪些?

图像分割大致分为两大类。

  1. 语义分割

  2. 实例分割

edbab95306771a0a09cd74e2665d9b94.png

检测到的对象 — 语义段 — 实例段?

在第一张图片中,我们可以看到检测到的对象都是男性。在语义分割中,我们认为所有这些像素都属于一类,因此我们用一种颜色表示它们。另一方面,在实例分割中,这些像素属于同一类,但我们用不同的颜色表示同一类的不同实例。

根据我们使用的分割方法,分割可以分为许多类别。

  • 基于区域的分割

  • 基于边缘检测的分割

  • 基于聚类的分割

  • 基于CNN的分割等。

接下来让我们看一个基于聚类的分割示例。


什么是基聚类的分割?

聚类算法用于将彼此更相似的数据点从其他组数据点更紧密地分组。

现在我们想象一幅包含苹果和橙子的图像。苹果中的大部分像素点应该是红色/绿色,这与橙色的像素值不同。如果我们能把这些点聚在一起,我们就能正确地区分每个物体,这就是基于聚类的分割的工作原理。现在让我们看一些代码示例。

from skimage.io import imread
from skimage.color import rgb2gray
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from scipy import ndimage
# Scaling the image pixels values within 0-1
img = imread('./apple-orange.jpg') / 255
plt.imshow(img)
plt.title('Original')
plt.show()

a14389a6b60f58acc6882771d3fbefe8.png

由于肉眼可见,图像中有五个色段

  1. 苹果的绿色部分

  2. 橙子的橙色部分

  3. 苹果和橙子底部的灰色阴影

  4. 苹果顶部和右侧部分的亮黄色部分

  5. 白色背景

让我们看看我们是否可以使用来自 scikit-learn 的 K 均值算法对它们进行聚类

# For clustering the image using k-means, we first need to convert it into a 2-dimensional array
image_2D = img.reshape(img.shape[0]*img.shape[1], img.shape[2])
# Use KMeans clustering algorithm from sklearn.cluster to cluster pixels in image
from sklearn.cluster import KMeans
# tweak the cluster size and see what happens to the Output
kmeans = KMeans(n_clusters=5, random_state=0).fit(image_2D)
clustered = kmeans.cluster_centers_[kmeans.labels_]
# Reshape back the image from 2D to 3D image
clustered_3D = clustered.reshape(img.shape[0], img.shape[1], img.shape[2])
plt.imshow(clustered_3D)
plt.title('Clustered Image')
plt.show()

de68dc383f35e3bb8677a9e627f41189.png

效果非常好,我们能够将五个部分组合在一起,这就是聚类分割的工作原理。目前有许多先进的技术,例如 Mask R-CNN,可以进行更细粒度的分割。

Github代码连接:

https://github.com/Mathanraj-Sharma/sample-for-medium-article/blob/master/cluster-based-segmentation-skimage/cluster-based-segmentation.ipynb

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三?+?上海交大?+?视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

70c9c036becbe08fa15765ed59ce60b2.png

a4e283b94bab0e62fb7abb51a87390ec.png

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-16 18:49:57  更:2021-11-16 18:50:01 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 5:51:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码