| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> YOLO系列 -> 正文阅读 |
|
[人工智能]YOLO系列 |
前言本文是博主整理的学习笔记,不是yolo讲解文章,适合有一定yolo基础的同学复盘学习。 yolo主要关注两个检测指标:mAP和速度。
精度和召回率互相矛盾,一个高,另一个就低。所以就直接用mAP一个指标了。其实就是iou的阈值设置的原因。 yolo的口号:速度第一,mAP第二。 YOLOV1yolov博主学习的较早,这次学习yolo系列没有重点关注这一部分,需要的同学可以移步这里。 网络结构卷积+全连接 指标
YOLOV2v2的改进: 网络结构
聚类提取先验框不按照预先定义的好长宽比例,而是从coco数据集(或自己的数据集)中聚类出5类比例,使用k-means,聚类距离使用的是1-iou。 Batch Normalization在yolov2中,已经舍弃了全连接层,因此也舍弃了dropout。每一个卷积层都加bn。 高分辨率输入224改成448,更接近实际图像。 Anchor Box数量:1313n。这个是为啥?不应该是32吗 v2的网格到底多大,不管它了。想通了。经过5次降采样,剩下的维度就是13×13了,就相当于网格是13×13.
Directed Location Prediction(坐标映射与还原)目的:位置微调,预测偏移量。
YOLOV3yolo原作者更新到v3就跑路了。 多尺度(scale)yolo的大改进终于来了,之前对小目标检测效果一直不好,这不,针对小目标的多尺度它就来了。 Resnetresnet在网络结构里对应的是shortcut层,注意在v3的网络机构里,shortcut层对应的相加的操作,也就是维度不会有任何改变,是数值上的改变。而route层是拼接的操作,是数值不变,维度相加。 softmax->logistic因为考虑到多类别时有些物体可能同时属于多类,比如既属于狗,又属于哈士奇。 网络结构darknet53(就是resnet卷积) YOLOV4yolov4的作者不是原作者(但是得到了原作者的认可),在4版本没有什么原创内容,但带来的效果比原创更好。作者融合了当下最前沿的一些算法,把效果好的能试的都试了,融合在了网络里。是一个集大成者。 Bag of Freebies(BOF)只增加训练成本,不影响推理速度。如:
马赛克数据增强参考了cutmix dropblock直接吃掉一个区域,增加游戏难度. labelsmothing-标签平滑[0,1]—>[0.05,0.95] iou-giou-diou-ciou损失(1)iou损失 soft-nms(diou-nms)之前yolo用的nms都太生硬了,soft-nms就是对那些和高分框重合度较高的anchor并没有直接杀死,而是下调了得分,然后它又有资格参与计算了。最终会显示出来吗?这个暂时没弄清。 Bag of specials(BOS)稍微增加推算代价,但能提高模型精度。如:
SPPNet(spatial pyramid pooling)在v3中为了更好得满足不同的输入大小,需要在训练的时候改变输入数据的大小。 CSPNet* 核心将特征图的channel分成两部分,一部分正常走流程,一部分直接拉后面concat,速度会更快,精度不下降。 SAM(CBAM)注意力机制CBAM是卷积 block attention module,嵌在卷积中的注意力 ,长这样 PAN(path aggregation network)FPN开始讲起。看这个图,想要提取特征,用了resnet,p2-p5提取的是不同层次的特征。为了融合不同层次的特征,fpn中是自顶向下流动。橙色箭头。 Mish激活函数relu有点太绝对了,mish更符合实际情况。感觉就是把leaky relu做的更丝滑了 网络架构
YOLOV5v5版本与前四个版本都不一样,前四个都是偏学术的论文版本,v5没有论文,是一个更偏工程化的代码,相当于是从工程上对yolov4更好的实现. |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 15:49:49- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |