IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 卷积神经网络初步(一零一)——知识扩充:深度学习在图像领域的几种任务 -> 正文阅读

[人工智能]卷积神经网络初步(一零一)——知识扩充:深度学习在图像领域的几种任务

深度学习在图像方面的任务大多沿袭自传统的计算机视觉领域,且与其他方向的称呼可能有所差异。
题主本身的研究方向是遥感,因此在刚刚踏足深度学习领域时,被称呼迷惑走了不少弯路。
这个系列的本来目的就是要帮助小白走出初期的迷惑期,省出乱翻资料的时间,因此本文放在了介绍完LeNet所代表的典型卷积神经网络结构之后,使用代码进行实现之前。请在阅读本文之前,先行阅读:

卷积神经网络初步(零):从原始汤到细胞
卷积神经网络初步(一):一个名为卷积神经网络的细胞

请不要先阅读 卷积神经网络初步(二):细胞和组织,以免混乱。

主要可以分为四个大类:
分类(classification) 定位(Location) 检测(Detection) 分割(Segmentation

一、分类

与数字图像处理中惯常说的分类不同,深度学习中的分类指的是判别输入图像中是否包含或包含什么要素。我们随便拽过一张图。
在这里插入图片描述
这是RSOD卫图数据集中的一张。该数据集有且仅有四种类别,分别是飞机、油罐、立交桥和操场。我们需要将四种类别分别赋值(比如1,2,3,4),经过训练,当如上所示的影像输入训练好的模型时,分类模型的输出是该图片分别归属于四种类别的概率或者直接输出图片的类别。
大致 1.jpg —— models—— 2——OilTank

二、定位

定位模型给出的是类别在输入图像中的位置。在实际应用中,给出的通常是能包含住整个要素的矩形框。我们仍以上图为例。将上图输入训练好的定位模型之中,取决于训练时的输入数据,模型会给出整个油罐区域的矩形框,或者是逐个油罐划分的矩形框。
在这里插入图片描述

但是需要注意的是,定位算法的输出并不包括类别。如果输入图像中包含多种类别的要素,模型输出的矩形框对于所有类别,格式都是统一的。

大致 1.jpg —— model—— rectangle——XML或者TXT或者JSON

三、检测

检测(又称目标检测)模型可以看作在定位中加入了分类功能的模型,与分类不同的是,检测的输入是定位模型输出的矩形框内的图像。也即先定位后分类。

大致 1.jpg —— model—— rectangle——XML或者在这里插入图片描述
TXT或者JSON——model——XML或者TXT或者JSON(With category)
或者 1.jpg —— model—— XML或者TXT或者JSON(With category) model中同时包含两种功能。

四、分割

不同于分类对整张图像给出类别,检测对矩形框内图像给出类别,分割任务针对的是图像内的每一个像元。对每一个像元,分割模型都要输出一个类别。
在这里插入图片描述
大致 1.jpg —— model—— Polygon或1_Label.jpg

分割任务大致可以分为实例分割(Instance-level segmentation)和场景分割(scene-level segmentation)两种。两者在模型构建上差别不大。主要差别是舍弃还是保留未被归类的像素。

  人工智能 最新文章
Neo4j 实战篇(一)基于Py2Neo构建电影知识
消息传递神经网络(MPNN)内容及代码实践
OpenCV+百度云人脸识别项目及源码
实验5 卷积神经网络实验中
论文详解:Attention-based Extraction of
Tensorflow进阶
科技时代,如何保护个人隐私?
【元宇宙系列】游戏与元宇宙(下)——拉动
pytorch学习13:实现LetNet和学习nn.Module
LSTM的本质理解-正向传播
上一篇文章      下一篇文章      查看所有文章
加:2021-07-04 19:55:33  更:2021-07-04 19:55:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
360图书馆 购物 三丰科技 阅读网 日历 万年历 2022年5日历 -2022/5/24 3:50:55-
图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码