IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 深度学习——day7 计算机视觉中的对象检测(重要的YOLO算法) -> 正文阅读

[人工智能]深度学习——day7 计算机视觉中的对象检测(重要的YOLO算法)

Object Location 对象定位

localization and detection

在这里插入图片描述

利用神经网络解决对象分类和定位问题

Classification with localization

  • 标准的分类
    在这里插入图片描述
  • 如果想用框标记car,则可以采用监督学习,在softmax函数中多加四个参数定位car的位置并标记出来。
    在这里插入图片描述

Defining the target label y !!!!非常重要

  1. 首先假定场景中只有一个物体
  2. c1 c2 c3 c4代表四种类别,值为1则表示选中某个class
  3. bx by bh bw 是标记框的定位
  • Pc=0 代表检测不到物体,则y选择c4 = background
  • Pc =1 则其余参数在c 1 2 3 中选择并赋值 1 ,不是则赋值 0
    在这里插入图片描述
    这些数据最终训练了数据集
    Pc = 1时可用平方差检测误差,Pc=0 只需要统计检测精度

Landmark detection 特征点检测

  • 以人脸为例,将人脸图片输入卷积网络,然后输出特征,由此实现对图片的人脸检测和定位(图片集X、标签集Y)
    在这里插入图片描述

Object Dtection 对象检测

本节学习通过CNN进行对象检测

  • 采用基于滑动窗口的目标检测算法:
    1、一次选择一个小区域,一步一步遍历整个图片,标注0或1;选择框逐渐加大,最终检测出车辆位置
    2、明显的缺点:计算成本太高

Turning FC layer into convolutional layers

用卷积层代替全连接层

在这里插入图片描述

通过卷积实现滑动窗口对象检测算法

参考文献:[Sermanet et al, 2014,OverFeat: Integrated recognition, localization and detection using convolutional networks)
在这里插入图片描述

总结

在这里插入图片描述
边界框的位置仍不准确

Bounding box Predictions

输出精准的边界框 YOLO算法

YOLO算法:[Redmon et al.,2015,You Only Look Once: Unified real-time object detection] (相对很难读懂,但也可以看一看)

  • 观察对象的中点,将它分配到中点所在的格子
  • 速度很快,可达实时检测

在这里插入图片描述

  • 一些参数
    在这里插入图片描述

YOLO 算法

交并比 IoU&评估对象定位

在这里插入图片描述- More generally, loU is a measure of the overlap(重叠) between two bounding boxess.

Non-max suppression

非最大值抑制 :只检测一次对象,只输出概率最大的结果

example在这里插入图片描述

algorithm

  1. 去掉所有小于阈值(低概率 pc)的边框
  2. 一直选择pc(概率)最高的边框
  3. 第一步去掉的边框和高亮边框IoU很大的都去掉
    在这里插入图片描述

Anchor boxes

一个网格单元有2个对象

  1. 预先定义两个不同的boxes
  2. 不同的box对应不同的对象
    在这里插入图片描述

algorithm

在这里插入图片描述

example

  • 两种处理不好的情况
    1、两个对象形状相似
    2、多于两个对象
    需要引入一些打破僵局的默认手段专门处理这种情况
    在这里插入图片描述
    有点,让数据集更有针对性,能检测出更具备特殊特征的人 ,YOLO 后期可用 k-means 选取 anchor boxes

YOLO 对象检测算法

  • 输入图片,卷积后输出

训练

在这里插入图片描述

预测

在这里插入图片描述

非最大值抑制输出

在这里插入图片描述

候选区域

文献来源:
[Girshik et. al, 2013,Rich feature hierarchies for accurate object detection and semantic segmentation]

如滑动窗口算法,窗口会路过很多无意义的区域,所以提出带区域的卷积算法:分割算法,在色块上放置边界框,减少处理量

在这里插入图片描述

Fast R-CNN算法

  • 首先得到候选区域
  • 再分类
    在这里插入图片描述
    Girshik et. al, 2013.Rich feature hierarchies for accurate object detection and semantic segmentation]I(Girchik 9015 Fast R-CNN]

Faster R-CNN算法

[Ren et. al, 2016.Faster R-CNN: Towards real-time object detection with region proposa
networks]
在这里插入图片描述
其实大多是faster -R-CNN算法还是不如YOLO算法

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-04 01:12:01  更:2022-09-04 01:14:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 22:57:38-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码