IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> PaddleDetection环境部署与小组分工 -> 正文阅读

[人工智能]PaddleDetection环境部署与小组分工

2021SC@SDUSC

PaddleDetection简介

PaddleDetection是基于PaddlePaddle的端到端对象检测开发工具包,可以帮助开发人员在训练模型的整个开发,优化性能和推理速度以及部署模型方面提供帮助。PaddleDetection在模块化设计中提供了各种对象检测体系结构,并提供了丰富的数据增强方法,网络组件,丢失功能等。PaddleDetection支持实际项目,例如工业质量检查,遥感图像对象检测以及具有模型等实际功能的自动检查。压缩和多平台部署。
PaddleDetection提供了丰富的模型,包括100多种预先训练的模型,例如对象检测,实例分割,面部检测等。它涵盖了冠军模型,适用于云和边缘设备的实用检测模型。
PaddleDetection关键操作在C++和CUDA中实现,再加上PaddlePaddle的高效推理引擎,可以在服务器环境中轻松部署。
PaddleDetection组件设计为模块化。通过简单的配置更改即可轻松定制模型体系结构以及数据预处理管道。
借助基础的PaddlePaddle框架,PaddleDetection可以加快培训速度并减少GPU内存占用。另外,与其他框架相比,YOLOv3培训要快得多。另一个示例是Mask-RCNN(ResNet50),在多GPU训练期间,每个GPU(Tesla V100 16GB)最多容纳4张图像。

环境部署与安装

  1. 下载好Paddle预测库。选择win10下的cuda10版本
  2. 下载好PaddleDetection的代码:选择release0.4
  3. 将上述预测库、PaddleDetection代码、opencv放在一个文件夹中
  4. 打开Cmake软件,添加编译来源和编译输出。
  5. 编译文件来源PaddleDetection代码中deploy/cpp。作者自定义便于输出,在编译来源文件夹同一个目录下,创建了一个out文件夹。
  6. 点击Configure,选择x64模式
  7. 然后点击3 Open Project会发现我们编译生成的项目。
  8. 在VS下进行调试 。最先选择release模式,找到main文件夹,并右键点击–重新生成

组内分工

我负责Anchor Free系列模型相关内容的研究

Anchor Free系列模型

简介

目前主流的检测算法大体分为两类: single-stage和two-stage,其中single-stage的经典算法包括SSD, YOLO等,two-stage方法有RCNN系列模型,两大类算法在PaddleDetection Model Zoo中均有给出,它们的共同特点是先定义一系列密集的,大小不等的anchor区域,再基于这些先验区域进行分类和回归,这种方式极大的受限于anchor自身的设计。随着CornerNet的提出,涌现了多种anchor free方法,PaddleDetection也集成了一系列anchor free算法。

模型库与基线

在这里插入图片描述

算法细节

CornerNet-Squeeze

简介: CornerNet-Squeeze 在Cornernet基础上进行改进,预测目标框的左上角和右下角的位置,同时参考SqueezeNet和MobileNet的特点,优化了CornerNet骨干网络Hourglass-104,大幅提升了模型预测速度,相较于原版YOLO-v3,在训练精度和推理速度上都具备一定优势。

特点:

  • 使用corner_pooling获取候选框左上角和右下角的位置
  • 替换Hourglass-104中的residual
  • block为SqueezeNet中的fire-module 替换第二层3x3卷积为3x3深度可分离卷积

FCOS

简介: FCOS是一种密集预测的anchor-free检测算法,使用RetinaNet的骨架,直接在feature map上回归目标物体的长宽,并预测物体的类别以及centerness(feature map上像素点离物体中心的偏移程度),centerness最终会作为权重来调整物体得分。

特点:

  • 利用FPN结构在不同层预测不同scale的物体框,避免了同一feature map像素点处有多个物体框重叠的情况
  • 通过center-ness单层分支预测当前点是否是目标中心,消除低质量误检

TTFNet

简介: TTFNet是一种用于实时目标检测且对训练时间友好的网络,对CenterNet收敛速度慢的问题进行改进,提出了利用高斯核生成训练样本的新方法,有效的消除了anchor-free head中存在的模糊性。同时简单轻量化的网络结构也易于进行任务扩展。

特点:

  • 结构简单,仅需要两个head检测目标位置和大小,并且去除了耗时的后处理操作
  • 训练时间短,基于DarkNet53的骨干网路,V100
    8卡仅需要训练2个小时即可达到较好的模型效果
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-01 16:51:20  更:2021-10-01 16:55:51 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 14:06:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码