IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 单阶段目标检测方法SSD介绍与分析 -> 正文阅读

[人工智能]单阶段目标检测方法SSD介绍与分析

SSD(single shot multi-box detector)

1. 简介

SSD是一种单阶段目标检测方法,如下图所示目标检测方法。
目标检测方法
单阶段和双阶段的区别:

  1. 双阶段第一阶段, 主要是找出目标物体出现的位置,初步得到建议框,这一部分时间花费较长;双阶段第二阶段, 对建议框,进行精确位置回归,和物体的分类。
  2. 单阶段:不需要建议框,直接进行类别概率和位置坐标值的回归。

因此双阶段的优缺点就是位置更准确,准确率更高;但是时间更久。
单阶段的优缺点就是速度快,但是精确率会有损失。

2. 模型结构

SSD
SSD
原来的图更突出(上),我重新画了一个图(下),为了突出网络结构内容。

backbone

(1)位置
在这里插入图片描述

backbone就是背脊的意思,就是上图红框标出的部分。
(2)作用
这一部分的作用就是提取特征,后面预测框位置回归和分类回归,都是基于这一部分提取的特征进行的。
(3)详细信息(以VGG16为例)
这一部分其实就是一个深度卷积神经网络。原始的SSD是以VGG16的conv4_3层输出到预测部分,然后把conv5_3层特征图层输出到下一层。

neck

(1)位置
neck
提取特征输出到预测部分之间的部分均可称为Neck。
(2)作用
主要是对提取的特征进行二次加工再给预测部分。这里说的二次加工,如FPN、PAN、深浅层特征融合等。
(3)详细信息
SSD在这一部分主要是对backbone输出的特征进行下采样(1×1的卷积对通道进行压缩,步长为2的3×3卷积进行下采样,相比maxpooling保留更多细节信息),并将各个下采样的特征图层输入到预测部分。

head

(1)位置
head
head就是最终的预测部分,输出预测结果。
(2)过程

  1. 对于每个预测框,首先根据置信度确定类别,并去除类别是背景的框;
  2. 去除类别置信度低于阈值(自己设定,如0.6)的框;
  3. 对剩下的预测框进行解码。根据预测的偏置(回归的是位置偏置,不是位置)与先验框位置大小得到位置参数(做clip,防止预测框位置超出图片);
  4. 对预测框根据置信度进行排列,保留前k个预测框;
  5. 最后就是进行NMS算法,过滤掉那些重叠度较大的预测框;
  6. 剩余的预测框就是检测结果。

(3)详细信息
直接对位置偏执和类别置信度进行回归,这就需要卷积出来的特征图层满足大小为 n×n×(a×(4+k))

  1. n×n就是特征图层每个通道上的大小,因为是以每个像素为锚框进行先验框的标定;
  2. (a×(4+k))就是通道量:
    (1)a就是预测框的数量;
    (2)4就是各个偏置 (x,y,w,h);
    (3)k就是需要预测的类别数量;
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-10-31 11:56:46  更:2022-10-31 12:00:16 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 21:44:21-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码