IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> YoloV1——总结 -> 正文阅读

[人工智能]YoloV1——总结

1.概述

YoloV1是一个快速、准确的目标检测网络,优缺点如下:

优点:

1.具备实时性,网络运行速度超过45fps

3.网络结构简单,端到端

4.可用于多种对象的检测

缺点:

1.目标定位较粗糙

2.对小目标检测不太好

3.每个cell只能生成2个框,并且只能有一个类

2.网络结构

说明:网络有24个卷积层,然后是2个完全连接的层。交替的1×1个卷积层减少了前一层的特征空间。

3.检测过程中的参数

1.输入一张图片

2.系统将图片分割为一个S\times S的网格,如果一个对象的中心落入一个网格单元格中,则该网格单元格负责检测该对象。

3.每个网格单元格预测边界框和这些边界框的置信度分数。这些置信度分数反映了模型对边界框包含物体的信心,也反映了它认为盒子预测的准确性。

confience=Pr(Object)*IOU_{truth}^{pred}

注:如果单元格中不包含对象则Pr(Object)=0,包含对象Pr(Object)=1

4.每个单元格2个预测框,每个框里面有六个参数,分别是x,y,w,h,confidence(x,y)是预测框的中心坐标,w,h分别是预测框的宽和高,confidence是置信度。此外,每个单元格还有一个参数C,其是某几类对象的概率集合。

5.计算每个预测框的得分:

Score=C*IOU_{pred}^{truth}

6.Yolov1最终会将一张图片编码成一个如下张量:

S\times S\times \left ( B*5+C \right )

????????其中B是每个单元格的预测框数量。

????????在论文中,S=7,B=2,C=20

4.训练

1.作者先在ImageNet1000上预训练前20层卷积层加一个平均池化层和一个全连接层。

2.然后作者又在20层卷积层后面加了4层卷积层和随机初始化权值的完全连接层。

3.作者还把网络的输入从224\times 224增加到了448\times 448

4.作者还基于图像的大小,把预测框的w,h缩放到了0到1之间。

5.网络的最后一层使用的是线性激活函数:

\phi (x)=\left\{\begin{matrix} x, ifx>0\\ 0.1x,otherwise \end{matrix}\right.

6.在每个图像中,许多网格单元格不包含任何对象。这将这些细胞的confidence分数推向零,通常超过了确实包含物体的细胞的梯度。这可能导致模型不稳定,导致训练在早期出现分歧。为了解决这一点,作者增加了边界框坐标预测的损失,并减少了不包含对象的框的一致性预测的损失。

7.误差度量应该反映大预测框的小偏差比预测框的小偏差小。为了部分解决这个问题,我们预测边界框宽度和高度的平方根,而不是直接预测宽度和高度。

5.损失函数

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-15 22:31:54  更:2022-03-15 22:32:58 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 15:52:23-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码