IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 2021-08-20 论文:目标检测 -> 正文阅读

[人工智能]2021-08-20 论文:目标检测

Faster R-CNN

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. 1506
[paper]

  • r p n _ l o s s rpn\_loss rpn_loss

在这里插入图片描述
其中,
? ? i i i:某个minibatch中,第 i i i个anchor
? ? p i p_i pi?:二分类的预测值 ? ? ? ? ? ? ? ? p i ? p_i^* pi??:gt { 1 I o U ( g t , a n c h o r ) > 0.7 0 I o U ( g t , a n c h o r ) < 0.3 \begin{cases}1 &IoU(gt,anchor)>0.7 \\ 0 &IoU(gt,anchor)<0.3\end{cases} {10?IoU(gt,anchor)>0.7IoU(gt,anchor)<0.3?
? ? t i t_i ti?:回归位置的预测值 ? ? ? ? ? ? ? ? t i ? t_i^* ti??:gt,计算如下:

在这里插入图片描述

  • RPN 架构:

[zhihu]

在这里插入图片描述
AnchorTargetCreator:生成正负anchor,计算 r p n _ l o s s rpn\_loss rpn_loss.
ProposalCreator:生成RoIs(region of interests)作为训练样本传给RoIHead.

  1. 选取得分大前12000个anchor,用回归参数修正位置,得到RoIs.
  2. 再利用NMS,得到2000个RoIs.
    (输出形如2000×4的tensor,这部分不进行反向传播)
  • RoIHead:

在这里插入图片描述RoI Pooling:将不同尺寸的特征图区域(128sample_rois)pooling成固定的尺寸 7 ? 7 7*7 7?7.
FC 21:用来分类,预测RoIs属于哪个类别(20个类 + + + 背景)
FC 84:用来回归(21个类 × × × 4个位置参数)

  • r o i _ l o s s roi\_loss roi_loss
  1. Train:
    ProposalTargetCreator :选择128个正、负sample_rois用以训练.计算roi_loss.
  2. Test:
    所有rois算概率,用回归参数调整,然后再NMS.
    (实验发现,RPN生成RoI越多,mAP越高)
  3. RPN时,已对anchor做了一遍NMSRoIHead_Test时,再做一遍
    RPN时,已对anchor位置做了回归调整;RoIHead_Test时,再做一遍
  • L o s s Loss Loss

L o s s = L o s s r p n ( c l s 2 , r e g ) + L o s s r o i ( c l s 21 , r e g ) Loss=Loss_{rpn}(cls_2,reg)+Loss_{roi}(cls_{21},reg) Loss=Lossrpn?(cls2?,reg)+Lossroi?(cls21?,reg)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-21 15:22:26  更:2021-08-21 15:23:17 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/1 12:24:57-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码