IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 目标检测——day44 Tiny Object Detection in Aerial Images -> 正文阅读

[人工智能]目标检测——day44 Tiny Object Detection in Aerial Images

资源下载

原文PDF

点击下载原文pdf

代码和数据集

本文:https://github.com/jwwangchn/AI-TOD

MMDetection library :https://github.com/open-mmlab/mmdetection
For TridentNet:https://github.com/TuSimple/simpledet
YOLOv3:
https://github.com/pjreddie/darknet
CenterNet:https://github.com/xingyizhou/CenterNet

I. INTRODUCTION

A. contributions

  1. 建立了 AI-TOD, 用于航空图像中微小物体检测的数据集。
  2. 提出了一个基于多中心点的学习网络(M-CenterNet),用于微小物体检测,它在AP和oLRP指标上的AI-TOD数据集中获得了最先进的性能。

III. DATASET DETAILS

A. Dataset Construction Process

该数据集包含8个类别的700,621个目标实例,涉及28,036个航空图像,大小为800×800像素。训练集和验证集的图像和注释都将公开可用。

TABLE I,每个图像集和每个类的对象数。在这里插入图片描述

Fig. I,AI-TOD与其他基准数据集的比较,AI-TOD中最大的物体小于64像素,AI-TOD中86%的物体小于16像素。在这里插入图片描述

B. AI-TOD Statistics在这里插入图片描述

  1. Fig. 2 (a):显示有一些不常见的类别(如游泳池(SP)、风车(WM))的物体数量明显少于其他更频繁的类别,对于现实应用非常重

  2. Fig. 2 (b):AI-TOD中每幅图像的物体计数可达2667个,远远高于无论是自然图像还是航空图像中的普通物体检测数据集。

  3. Fig. 2 ? &TABLE II:AI-TOD绝对尺寸的均值和标准差分别为12.8像素和5.9像素,比其他自然图像和航空图像数据集要小得多。在这里插入图片描述

  4. Fig. 2 (d):箱形图显示了AI-TOD各类别的面积统计数据

IV. M-CENTERNET FOR TINY OBJECT DETECTION在这里插入图片描述

Fig.3(a):为原中心网的设计,红圆点为特征图上真实的中心点;蓝点和灰圆点作为正负样本Ogt为对应正样本的偏移量,s为特征图的输出步幅。在这种情况下,预测的边界盒和地面真实值的单位可能小于0.5,这个对象将被遗漏。
Fig.3(b):多个中心点的设计,我们将真实中心点附近的4个点作为阳性样本,除阳性样本外的点均为阴性样本。红圆点为特征图上的真实中心点Cr =(cx/s,cy/s),蓝点为训练周期内的正样本,O_gt 为相应正样本的偏移量。
在这里插入图片描述

Fig.4,AI-TOD中标注图像的样本。最好的彩色和放大。

V. EXPERIMENTS

TBALE III所示,在APvt和APt指标方面,M-CenterNet远远超过了其他检测器。在这里插入图片描述
此外,如TABLE IV 所示,在这里插入图片描述
M-CenterNet在五类(桥梁(BR)、仓库(ST)、车辆(VE)、人员(PE)和风车(WM))上表现最好。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-10-22 21:15:35  更:2022-10-22 21:15:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 20:52:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码