IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 计算机视觉(YOLO算法系类)—V1 -> 正文阅读

[人工智能]计算机视觉(YOLO算法系类)—V1

前言:
? 作者简介:CC++Edge淇,大家可以叫我--斯淇。(CSDN优质博主建议加这一条!)
📑 个人主页:CC++Edge淇主页
📫 如果文章知识点有错误的地方,请指正!和大家一起学习,一起进步👀
🔥 如果感觉博主的文章还不错的话,还请不吝👍关注、点赞、收藏三连支持👍一下博主哦
💬 人生格言:这世界形形色色,做好自己才是真!-——从入门到现在不容易~💬
每日推荐书:《opencv基础教程》

一、前言(百度百科)

YOLO系列是one-stage且是基于深度学习的回归方法,而R-CNN、Fast-RCNN、Faster-RCNN等是two-stage且是基于深度学习的分类方法。

016年,Joseph Redmon、Santosh Divvala、Ross Girshick等人提出了一种单阶段(one-stage)的目标检测网络。它的检测速度非常快,每秒可以处理45帧图片,能够轻松地实时运行。由于其速度之快和其使用的特殊方法,作者将其取名为:You Only Look Once(也就是我们常说的YOLO的全称),并将该成果发表在了CVPR 2016上,从而引起了广泛地关注。

YOLO 的核心思想就是把目标检测转变成一个回归问题,利用整张图作为网络的输入,仅仅经过一个神经网络,得到bounding box(边界框) 的位置及其所属的类别。

深度学习经典检测方法:

  1. TWO-STAGE(两阶段):Faster-rcnn Mask-Rcnn系列
  2. ONE-stage(单阶段):YOLO系列

ONE-stage:

???????????????????? 最核心的优势:速度非常快,适合做实时检测任务!

???????????????????? 但是缺点也是有的,效果通常情况下不会太好!

个人理解:这个算法衡量的(两个指标)1.FPS的速度是快还是慢,2.mAP值的好坏!

TWO-STAGE:

  1. 速度通常比较慢(5FPS),但是效果通常还是不错的
  2. 非常实用的通用框架MaskRcnn,建议熟悉下!

指标分析

????????????? map指标:综合衡量检测效果;单看精度和recall不太行!?

关于.YOLO系列指标分析:

TP的意思:true positives (TP正类判定位正类)

FP就是负类判定为正类“存伪”

FN:正类判断为负类“去真”,明明是小狗偏给判断为小猫!

TN:负类判定为负类!

? ? ? ? ? ? ? ? ? ? ? ? ?? ?检测任务中的精度和召回率分别代表

基于置信度阈值来计算,例如分别计算0.9;0.8;0.7

0.9时:TP+FP = 1,TP = 1 ;FN = 2;Precision=1/1;Recall=1/3;

????????????????????????????????????????????????YOLO-V1

把检测问题转化成回归问题,一个CNN就搞定了!

可以对视频进行实时检测,应用领域非常广!

YOLOv1采用的是“分开使用的”的策略,将一张图片平均分成7×7个网格,每个网格分别负责预测中心点落在该网格内的目标。通过这种方式,我们就不需要再额外设计一个RPN网络,这正是YOLOv1作为单阶段网络的简单快捷之处!

网络架构:

  1. 网络输入:448×448×3的彩色图片。
  2. 中间层:由若干卷积层和最大池化层组成,用于提取图片的抽象特征。
  3. 全连接层:由两个全连接层组成,用来预测目标的位置和类别概率值。
  4. 网络输出:7×7×30的预测结果。
  5. YOLO在输入连接里面有一个全连接层,所以说这里必须做一个限制输入数据的大小(必须是448*448*3)
  6. 并且需要杂计算机里面设计一个损失函数,在损失函数里面(设置好损失的最小值)

??????????????????????????????????????????????每个数字的含义:

1.10 =(X,Y,H,W,C)*B(2个)

2.当前数据集中有20个类别

3.7*7表示最终网格的大小

4.(S*S)*(B*5+C) ?给出最终预测结果等于多少!

损失函数:

损失由三部分组成,分别是:坐标预测损失、置信度预测损失、类别预测损失

定位误差比分类误差更大,所以增加对定位误差的惩罚,使λ c o o r d = 5 λ。

YOLO-V1 (V1 内容介绍一遍)

优点:快速,简单!

问题1:每个Cell只预测一个类别,如果重叠无法解决

问题2:小物体检测效果一般,长宽比可选的但单一

具体说明一点优点:

  1. YOLO检测的速度其实非常快,拿标准版的YOLO来说每秒可以处理的图像为40-45秒每张图片!当然极速版的可以处理150帧的图像!!!!这也就是YOLO优于其他的方式!!
  2. YOLO的检测能力要比其他的监测系统快两倍!其迁移能力强,能过运用于多种的新的领域!

局限:

  1. YOLO对于小的群体的检测效果并不好,如果同时检测两个框,并且属于同一个类可能会出现错误!!
  2. 损失函数的问题也同样影响大,定位误差以及检测效果的偏移,和不同之间的角度问题上同样偏弱!

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-07-21 21:32:47  更:2022-07-21 21:35:26 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 0:51:22-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码