| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> YoloV1——总结 -> 正文阅读 |
|
[人工智能]YoloV1——总结 |
1.概述YoloV1是一个快速、准确的目标检测网络,优缺点如下: 优点: 1.具备实时性,网络运行速度超过45fps 3.网络结构简单,端到端 4.可用于多种对象的检测 缺点: 1.目标定位较粗糙 2.对小目标检测不太好 3.每个cell只能生成2个框,并且只能有一个类 2.网络结构说明:网络有24个卷积层,然后是2个完全连接的层。交替的1×1个卷积层减少了前一层的特征空间。 3.检测过程中的参数1.输入一张图片 2.系统将图片分割为一个的网格,如果一个对象的中心落入一个网格单元格中,则该网格单元格负责检测该对象。 3.每个网格单元格预测边界框和这些边界框的置信度分数。这些置信度分数反映了模型对边界框包含物体的信心,也反映了它认为盒子预测的准确性。 注:如果单元格中不包含对象则,包含对象。 4.每个单元格2个预测框,每个框里面有六个参数,分别是,是预测框的中心坐标,分别是预测框的宽和高,是置信度。此外,每个单元格还有一个参数,其是某几类对象的概率集合。 5.计算每个预测框的得分: 6.Yolov1最终会将一张图片编码成一个如下张量: ????????其中B是每个单元格的预测框数量。 ????????在论文中, 4.训练1.作者先在ImageNet1000上预训练前20层卷积层加一个平均池化层和一个全连接层。 2.然后作者又在20层卷积层后面加了4层卷积层和随机初始化权值的完全连接层。 3.作者还把网络的输入从增加到了。 4.作者还基于图像的大小,把预测框的缩放到了0到1之间。 5.网络的最后一层使用的是线性激活函数: 6.在每个图像中,许多网格单元格不包含任何对象。这将这些细胞的分数推向零,通常超过了确实包含物体的细胞的梯度。这可能导致模型不稳定,导致训练在早期出现分歧。为了解决这一点,作者增加了边界框坐标预测的损失,并减少了不包含对象的框的一致性预测的损失。 7.误差度量应该反映大预测框的小偏差比预测框的小偏差小。为了部分解决这个问题,我们预测边界框宽度和高度的平方根,而不是直接预测宽度和高度。 5.损失函数 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/9 15:52:23- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |