| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 卷积神经网络(三)- 目标检测 -> 正文阅读 |
|
[人工智能]卷积神经网络(三)- 目标检测 |
本次学习笔记主要记录学习深度学习时的各种记录,包括吴恩达老师视频学习、花书。作者能力有限,如有错误等,望联系修改,非常感谢! 卷积神经网络(三)- 目标检测
第一版???????2022-07-18????????初稿 一、目标定位(Object localization)
若正在构建汽车自动驾驶系统,对象可能包括:行人、汽车、摩托车和背景。定位可以让神经网络多输出4个数字,记为bx,by,bh,bw,是被监测对象的边界框的参数化表示。 如图的汽车图片,如其下方;没有检测对象时,如汽车图片右方图片下方,pc=0,其他参数则毫无意义。 最后定义神经网络的损失函数,参数为类别y和网络输出yhat,采用平方误差策略。 二、特征点检测(Landmark detection)
最后一个例子,若对人体姿态感兴趣,可定义一些关键特征点。特征点1的特性在所有图片中必须保持一致。 三、目标检测(Object detection)
此算法叫做滑动窗口目标检测。缺点是计算成本。 四、滑动窗口的卷积实现(Convolutional implementation of sliding windows)
五、Bounding Box预测(Bounding Box predictions)
若训练100x100x3的神经网络,经过卷积层,最大池化等,最后得到3x3x8输出尺寸。当使用反向传播训练神经网络时,将任意输入x映射到这类输出向量y。 YOLO算法有个优点就是其是个卷积实现,运行速度非常快,可以达到实时识别。 还有其他参数化方式,涉及到sigmoid函数,确保0-1之间。指数参数化确保bh和bw都是非负数。 六、交并比(Intersection over union)
七、非极大值抑制(Non-max suppression)
分步介绍非极大值抑制: 如图例子,只做汽车检测,会得5个参数。 八、Anchor Boxes
anchor box思想: 现在有两个框,可看成是3x3x2x8。 YOLO后期有更好做法,即K-mean算法,可将两类对象形状聚类。 九、YOLO算法(Putting it together:YOLO algorithm)
十、(选)候选区域(Region proposals)
本节引用了R-CNN的算法,意思是带区域的CNN,此算法尝试选出一些区域,在这些区域上运行卷积网络分类器是有意义的,不对每个滑动窗口运行检测算法,只选一些窗口运行卷积网络分类器。 分割算法检测到色块,然后做分类。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/29 8:47:09- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |