IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> R-CNN系列简要总结(RCNNFastRCNNFasterRCNN) -> 正文阅读

[人工智能]R-CNN系列简要总结(RCNNFastRCNNFasterRCNN)

R-CNN:Region with CNN feature
内容基于 b站霹雳吧啦Wz 博主,讲的很好,这里做简要总结。

R-CNN:只有Feature extraction是CNN,其他是传统的机器学习方法。

关键步骤:

  • SS得到约2k个候选区域
  • 将约2k个候选区域分别使用AlexNet提特征,
  • 将提的特征用SVM做分类(假设分类20类,即voc数据集的类别数)。然后对每一类使用NMS,得到每一类得分最高的一些建议框。
  • 训练时,进一步筛选(将NMS后建议框与groundtruth IoU较低的框删掉),然后再使用20个回归器对剩余的建议框对应的cnn特征图进行回归操作(最小二乘法),以进行修正。
    在这里插入图片描述
    最下方的流程图是SS-CNN-SVM的分类过程:↓SS-CNN-SVM
    存在的问题:
  • predict很慢,cpu上一张图约53s,且SS后的候选框有大量冗余
  • 训练很慢很繁琐
  • 对SVM和回归器的训练需要将cnn得到的特征保存下来,所以占用硬盘空间很大,上百G。

Fast R-CNN:除SS算法外,特征提取、分类以及回归使用一个CNN网络实现。
且其不对每个SS后的候选框做特征提取,而是对整幅图做特征提取生成特征图,然后将候选框位置映射到特征图上,获得候选框所对应的特征图。大大减少了运算量。比R-CNN快200倍以上。
在这里插入图片描述
在这里插入图片描述
关键步骤:

  • SS操作后对2k候选区域筛选64个感兴趣区域(正样本+负样本)进行训练。
  • RoI Pooling Layer:将候选区域图像划分为7*7共49个小区域(这样对候选区域无需做resize),然后对每个小区域做maxpooling。
  • 将RoI的输出做flatten并使用并联的FC层分别做分类和回归。其中分类器的最终节点有N+1个,即前景类别数量+背景;回归器有(N+1)*4个节点,4代表对x,y,w,h四个量的预测,N+1代表每个类都有单独的边界框回归。
    在这里插入图片描述

损失loss:分类损失使用CE(Cross Entropy) loss,回归使用smooth L1 loss。[u≥1]是艾弗森括号,其中u代表该候选区域的真实标签 (0代表背景,1-N代表前景的类),当u≥1时[u≥1]=1,u≤1时[u≥1]=0,即只将前景的回归损失计入。
在这里插入图片描述
其中回归的损失:在这里插入图片描述

Faster R-CNN:Fast R-CNN的速度瓶颈在SS算法,所以新作针对候选框的生成进行改进。

在这里插入图片描述FasterRCNN = FPN + FastRCNN(之前使用的SS算法,现在替换成RPN),即本作的重点就是RPN网络。其中k是anchor boxes的数量,RPN(Region Proposal Net)结构:RPN
其中关于RPN的感受野该博主在VGG视频中有讲。还会对anchor boxes进行一些筛选操作:在这里插入图片描述
其中训练时需要对anchor boxes进行正负样本的采样,每张图取256个样本,其中正负样本比大概1:1。正样本取与ground truth 的IoU超过阈值(论文取0.7)的(没有超过阈值的就取最大的),负样本取与与所有ground truth的IoU小于0.3的。

在这里插入图片描述
分类损失:论文中使用多分类的SCE(softmax CE)损失来计算这个二分类损失,因为其score输出是2k个,如果使用BCE也可以,但网络就是k个输出了。
在这里插入图片描述
边界框回归损失:与FastRCNN的边界框回归损失是一样的
在这里插入图片描述
剩下的部分就是Fast RCNN了。

训练:
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-01 15:44:16  更:2022-05-01 15:44:21 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/6 17:56:33-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码