IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 目标检测——day 53 Concealed Object Detection -> 正文阅读

[人工智能]目标检测——day 53 Concealed Object Detection

3 COD10K DATASET

本章总体介绍了COD10K的训练过程,细节等,还与其他数据集对比,总之是为COD模型服务的。
Fig. 3COD10K 每张图像有六种不同的注释内容
Fig. 8COD10K 有大量全高清1080p分辨率的图像

4 COD FRAMEWORK

Fig. 13COD总体架构在这里插入图片描述

4.2 Search Phase

4.2.1 Feature Extraction

在这里插入图片描述

  • 首先是对输入图像的特征提取:采用Res2Net-50网络,涵盖了从高分辨率,弱语义到低分辨率,强语义的多样化特征金字塔

*(removing the top three layers, i.e., ‘average pool’, ‘1000-d fc’, and ‘softmax’) *

4.2.2 Texture Enhanced Module (TEM)

在这里插入图片描述

  • 每个TEM组件包括四个平行的残差分支和一个捷径分支 (灰色箭头)
  • 对比标准的感受野模块,TEM增加一个具有较大扩张速率的分支,以扩大感受野,并进一步用两个不对称卷积层代替标准卷积

4.2.3 Neighbor Connection Decoder (NCD)

在这里插入图片描述

  • NCD负责在TEM的协助下找到隐藏物体的相对粗糙的位置
  • 为了提升学习能力,只汇总前三个最高级别的特征
  • 本文使用邻居连接函数修改了部分解码器组件 (PDC) ,并获得了三个改进的功能,计算如式(1)所示
  • 在这里插入图片描述

4.3 Identi?cation Phase

在搜索阶段得到的只能够捕捉隐藏物体的相对粗略位置,而忽略了结构和纹理细节。

4.3.1 Reverse Guidance

为了解决这个问题,我们引入了一种原则性的策略,通过删除对象来挖掘有区别的隐含区域。
在这里插入图片描述

Fig, 14b所示,通过Sigmoid函数和反转运算输出反向注意力引导r1^k
式(2)
在这里插入图片描述

4.3.2 Group Guidance Operation (GGO)

  • 团体引导操作包含两个主要步骤。
    反向注意力是通过从侧面输出特征中删除现有的估计目标区域来挖掘互补区域和细节。
    我们提出了一种新的GroupWise操作来更有效地利用先验反向引导。如Fig. 14a所示:
    在这里插入图片描述

在这里插入图片描述

  1. 首先,我们沿着通道维度将候选特征p分成N组。
  2. 然后,再分割特征p,之间周期性地内插先验引导rk。

4.3.3 Group-Reversal Attention (GRA)

分组反向注意力模块(GRA),它协同工作从更深的层改进粗略的预测。通过不同的特征金字塔逐步细化粗略预测。式(4、5、6):
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-11-05 00:28:48  更:2022-11-05 00:30:55 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 20:36:34-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码