IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 吴恩达深度学习（笔记+作业）·第四课·第三周目标检测（重点解析YOLO算法） -> 正文阅读

[人工智能]吴恩达深度学习（笔记+作业）·第四课·第三周目标检测（重点解析YOLO算法）

目录

一、目标定位

二、特征点检测（另一种思路）

三、目标检测算法? object detection algorithm

四、卷积的滑动窗口实现

五、Bounding Box预测（YOLO算法的精髓）

六、交并比 IOU

七、非极大值抑制 non-max suppression

八、锚框 Anchor Boxes

九、YOLO算法

十、候选区域 Region proposals

一、目标定位

?

?

二、特征点检测（另一种思路）

?

?标签特征点的顺序，在所有的样本数据集当中都必须一致

?

三、目标检测算法? object detection algorithm

滑动窗口的目标检测算法 the sliding windows detection algorithm

标签数据集：照一张照片，然后剪切，剪掉目标以外的部分，使目标居于中心位置，并基本占据整张图片，将标签设置为0/1

然后找一些同样处理过的图片，通过CNN进行训练，训练完毕之后，就可以通过滑动窗口目标检测算法

?

由于之前已经对卷积神经网络已经训练好了，这个时候取一个窗口，开始在所检测的图片上进行滑动，将图片上的这一窗口的图片传入训练好的CNN当中，预测判断整个窗口里有无目标，然后依次重复操作，直到划过窗口的每一个角落

调整滑动的速度，可以设置固定步幅进行遍历

?

?

?但是有很明显的缺点：计算成本

?在神经网络兴起之前，大家有用的都是比较简单的线性分类器，计算成本比较小，最后的效果也比较好，但是卷积神经网络的加入，倒是运行单个分类任务的成本高很多?

?

?

四、卷积的滑动窗口实现

?

??

?

?缺点：边界框的位置可能不太精确

五、Bounding Box预测（YOLO算法的精髓）

?YOLO算法基本原理是，将图片划分为网格（这里以3×3为例），使用图像分类和定位算法，然后将算法应用到9个格子上，那么如何定义训练标签呢？

就以第一块中讲的那个例子来说，对于每一个网格指定一个标签y，y是8维向量，那么y=（pc，bx，by，bh，bw，c1，c2，c3），这里一共有9个格子，那么就有9个这样的标签向量。

如果遇到所检测的目标占据了多个格子，那么就找到目标的中心点（目标的中心点就是bx-by），看看这个中心点落在哪一个格子里，那么这个目标就是属于哪一个格子，所以即便一个对象横跨多个方格，最后也只会被分配到9个格子中的一个！所以9个格子中的任意一个格子都会得到8维输出向量，那么对于3×3的格子而言，就会得到目标输出3×3×8

在训练的时候，假设输入100×100×3的图像，那么就将图片通过CNN转化为3×3×8的输出，同3×3×8的标签进行计算损失

那么如果一个格子中有两个目标的中心点怎么办？在实际情况中，我们会将格子划分成19×19（或其他），这样两个中心点分配到一个格子的概率就小得多

对于这个算法而言，可以得到比较精确的框，同时，是对整个图像进行单次卷积，共享了很多数据，降低了计算成本，所以算法的效率很高，运行速度很快，可以达到实时识别

?

?

?

六、交并比 IOU

?

如何表现算法检测精度的效果好坏呢——交并比

?

七、非极大值抑制 non-max suppression

你的算法可能对同一个对象做出多次检测，非极大值抑制可以确保，你的算法对每个对象只检测一次，非极大值抑制意味着你只输出概率最大的分类结果

? 首先找到图中概率最大的一个矩形框，然后将整个矩形框保留下来，找到和整个矩形框交并比的其他几个矩形框，然后将其抑制，这样，一个对象就只会留下一个概率最大的矩形框，然后找到图片中第二高的概率（第二个对象），同上面的做法进行非极大值抑制

?最后得到两个框！

?

?

八、锚框 Anchor Boxes

到目前为止，每个格子只能检测出一个对象，那么锚框可以做到一个格子检测到多个对象

?

????????

????????

?我们一般手动给定5个到10个anchor box形状，覆盖不同的形状

?

九、YOLO算法

?

?

?

十、候选区域 Region proposals

用图像分割算法，找到可能存在对象的区域，进行窗口检测

?

?

?

?大家可以看看这边的作业：

【中文】【吴恩达课后编程作业】Course 4 - 卷积神经网络 - 第三周作业 - 车辆识别

?

?

?另外我会在实战中用pytorch来操作

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2021-08-26 12:06:37 更:2021-08-26 12:08:54

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/23 14:09:08-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码