IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> YOLOv1 反向传播 -> 正文阅读

[人工智能]YOLOv1 反向传播

目标检测是监督学习的问题,监督学习的训练是通过梯度下降和反向传播的方法迭代地去微调神经元中的权重使得损失函数最小化的过程。

训练集中需要人工利用标注工具对训练图片进行各类加框标注,而我们算法就是让我们预测结果尽量拟合这个人工标注框,使得损失函数最小化。

人工正确标注框为ground truth,即标准答案。

绿框中心点所在的grid cell的2个bounding box中其中一个需要来负责来拟合这个ground truth,并且这个grid cell输出的最大权概率的类别也必须是这个ground truth的类别。

如上图2个bounding box,分别计算和ground truth的ioU,重叠较大的bounding box负责尽量去拟合ground truth,而重叠较小的bounding box只需要他的object尽量小即可。

如果一个grid cell并没有被任何ground truth的中心点落入,那个这个grid cell的2个bounding box的box置信度越小越接近0越好。


损失函数

YOLOv1是把目标检测问题当作回归问题来解决。

需要先把所有的输出包括(x,y,w,h)都定义在0到1之间。

ioU计算公式

  • 首先计算两个box左上角点坐标的最大值和右下角坐标的最小值
  • 然后计算交集面积
  • 最后把交集面积除以对应的并集面积

LOSS

共五项误差,全都是残差平方和的计算形式。(i:0-7*7?? j:2)

红框:负责检测物体的bounding box。绿框:不负责检测物体的bounding box。篮框:负责检测物体的grid cell。

因此如果红框为1,那么篮框也为1。红框和绿框如果有一个为1,另一个必为0。

第一项是负责检测物体(ioU较大)的bounding box的中心点于ground truth中心点(x,y)的定位误差。

第二项是负责检测物体的bounding box的宽高(w,h)定位误差。对w和h取根号是为了让大小框对损失函数影响更加公平,也就是同样偏差小框对损失函数影响更大,大框对损失函数影响更小。

第三项是负责检测物体的bounding box的box置信度误差。标签值指这个bounding box和ground truth的ioU,预测值指正向推断所得这个bounding box的box置信度。

第四项是负责检测物体的bounding box的box置信度误差。标签值为0,预测值也尽量逼近0。

第五项是负责检测物体的grid cell的分类误差。gride cell的第i类条件概率与ground truth的第i类条件概率(也就是1)进行误差计算,因此gride cell的第i类条件概率越接近1越好。

其中第一项和第二项(负责检测物体的bounding box)前面乘了一个较大的λ权重,第四项(不负责检测物体的bounding box)前面乘了一个较小的λ权重。这样增大负责检测物体的bounding box的影响,减小不负责检测物体的bounding box的影响。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-18 12:42:30  更:2021-08-18 12:42:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 19:45:34-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码