[人工智能] 2021-08-20 论文：目标检测

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 2021-08-20 论文：目标检测 -> 正文阅读

[人工智能]2021-08-20 论文：目标检测

Faster R-CNN

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. 1506
[paper]

$rpn\_loss$ ：

在这里插入图片描述
其中，
? ? $i$ ：某个minibatch中，第 $i$ 个anchor
? ? $p_i$ ：二分类的预测值 ? ? ? ? ? ? ? ? $p_i^*$ ：gt $\begin{cases}1 &IoU(gt,anchor)>0.7 \\ 0 &IoU(gt,anchor)<0.3\end{cases}$
? ? $t_i$ ：回归位置的预测值 ? ? ? ? ? ? ? ? $t_i^*$ ：gt，计算如下:

在这里插入图片描述

RPN 架构：

[zhihu]

在这里插入图片描述
AnchorTargetCreator：生成正负anchor，计算 $rpn\_loss$ .
ProposalCreator：生成RoIs（region of interests）作为训练样本传给RoIHead.

选取得分大前12000个anchor，用回归参数修正位置，得到RoIs.
再利用NMS，得到2000个RoIs.
（输出形如2000×4的tensor，这部分不进行反向传播）

RoIHead：

在这里插入图片描述 RoI Pooling：将不同尺寸的特征图区域（128个sample_rois）pooling成固定的尺寸 $7 ? 7$ .
FC 21：用来分类，预测RoIs属于哪个类别（20个类 $+$ 背景）
FC 84：用来回归（21个类 $\times$ 4个位置参数）

$roi\_loss$ ：

Train:
ProposalTargetCreator ：选择128个正、负sample_rois用以训练.计算roi_loss.
Test:
所有rois算概率，用回归参数调整，然后再NMS.
(实验发现，RPN生成RoI越多，mAP越高)
RPN时，已对anchor做了一遍NMS；RoIHead_Test时，再做一遍
RPN时，已对anchor位置做了回归调整；RoIHead_Test时，再做一遍