IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> yolov4简单介绍 -> 正文阅读

[人工智能]yolov4简单介绍

目标检测器(Object detector):

?

Input:image,patches,image pyramid,...

Backbone:VGG16,ResNet-50,ResNeXt-101,Darknet53...

Neek:FPN,PANet,Bi-FPN,...

Head

????????Dense Prediction:RPN,YOLO,SSD,RentinaNet,FCOS,...

????????Sparse Prediction:Faster R-CNN,R-FCN,...

(可以自由组合成一个网络)

YOLOv4:

Backbone:CSPDarknet53

Neck:SPP,PAN

Head:YOLOv3

YOLOv4前生:

YOLOv1:直接回归出位置

YOLLOv2:全流程多尺度方法

YOLOv3:多尺度检测头,resblock darknet53

学习模型步骤:

1、前向计算部分(90%)

2、损失函数:mean square error:MSE,cross enporty

3、反向传播部分

分类模型的输入与输出:

输入:矩阵

输出:Onehot

传统检测算法的主要思路:

耗时,最耗时的环节

操作复杂,需要手动生成大量样本

目标检测:滑动窗口分类方法

如何训练?如何组织样本训练?

1、本质上还是训练分类器

2、训练一个二分类器:背景,前景(待检测目标)

3、各个尺度的窗口都训练一个分类器

4、从原图上剪切出背景,归一化到统一大小

5、从原图上剪切出前景,归一化到统一大小

6、背景图片很多,前景图片少:二分类样本不均衡

训练的网络直接预测了12个框,如何得到最终的7目标?

方法一:聚类,聚成7类,然后在这7类中,取置信度得分最大的框

如果两个目标本身就比较接近?

两个框重合度很高,他们呢有很大概率表示的是同一个目标

两个目标与剩下的一个目标比较远?

可以根据框的重合度来完成“聚类”

如果不知道到底有几个目标?

两两遍历,认为重合度较大的那些框表示一个物体

如何衡量重合度?

IoU=交集/并集

NMS(非极大值抑制)

以下去除冗余框的过程:NMS(非极大值抑制)

两两遍历算重合度,计算量大,如何减少计算量:

1、得分置信度最高的框肯定是目标不用计算重合度:得到第一个框

2、既然找到了第一个框,就可以利用重合度,把与第一个框重合的其他框去掉(抑制掉)

3、剩下没有被抑制掉的框中,含有剩下的目标怎么办?

????????拿得分最高,得到第二个目标,抑制掉重合框

4、剩下的没有被抑制掉的框中,含有剩下的目标怎么办?

????????拿得分最高的,得到第三个目标,抑制掉重合框

5、没有剩下的框了,结束

检测模型的通病:小目标检测不佳,如何改善?

专门设计神经元你和小目标

yolov4的基础结构(yolov1):
优点:快,看一眼就出结果

缺点:与R-CNN比,框不准,召回低(很多没有被检测到)

如何做到又快又准又全面?

预测偏移量,基于anchor框和grid的偏移量

如何做到又快又准又全面?

yolo只用了一个尺度,从3个操作:

1、为了多尺度,输入图片尺寸要大

2、为了多尺度passthrough,检测头不能出现全连接,将其替换为卷积

3、多个尺度图片的训练

4、推理的时候,图片要大,保证多尺度训练不白费

预测偏移量,基于anchor框和grid的digmoid偏移量

增加候选框的数目,框也不再共用类别,3个操作:

1、7x7太小,增大为13x13

2、每个grid对应两个人为设定的anchor,增加为5个统计得到的anchor

3、每个anchoe对应一个类别

全流程多尺度,4个操作:

1、为了多尺度,输入图片尺寸要大

2、为了多尺度passthrough,检测头不能出现全连接,将其替换为卷积

3、多个尺度的图片训练

4、推理的时候,图片也要大,保证多尺度训练不白费

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-08 22:28:32  更:2022-03-08 22:29:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 2:17:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码