IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 了解目标检测领域的评估指标mAP -> 正文阅读

[人工智能]了解目标检测领域的评估指标mAP

目标检测的评价指标mAP是什么

目标检测旨在检测图像中是否有我们关注的物体存在,并且准确定位出这些物体在图像中的具体位置。但是我们怎么评价训练好的模型检测的准确不准确呢?mAP(mean Average Precision),相信目标检测领域的同学们都是耳熟能详。mAP顾名思义,就是各类别AP的平均值。AP是PR曲线下的面积,PR曲线就是以Precision(查准率)以纵坐标、Recall(查全率)为横坐标的坐标系下绘出的曲线,即Precision-Recall曲线,如图1所示。
在这里插入图片描述
                         图1. PR曲线
PR曲线上某一点的意义为:在某一阈值下,模型将大于该阈值的结果判定为正样本,小于该阈值的结果判定为负样本。再根据判定结果统计出TP、FP、TN以及FN,根据这四个统计量计算出对应的precision和recall。计算方式如下:
 
                       P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP?
  
                       R e c a l l   = T P T P + F N Recall =\frac{TP}{TP+FN} Recall =TP+FNTP?

所以PR曲线反映了模型在不同的阈值设定下(阈值的顺序为从高到低,这一点很重要,下文讲解mAP的计算方式时需要将confidence按照从高到低的顺序排列检测器输出的检测框信息,这里的confidence就是我们说的阈值)取得的precision和recall,可以说明模型的有效性和鲁棒性,适合用于评估模型的综合性能。
在目标检测任务中,模型的预测结果是一系列的矩形检测框集合,这其中包括了矩形检测框的中心点(或左上角顶点)的坐标,长宽、还有置信度(框内包含物体的概率)注意:置信度便与我们上边说的PR曲线计算的阈值有关,下面mAP的计算过程中会详细介绍。这里我们把矩形检测框的匹配形容为二分类问题,矩形检测框为正样本,ground truth(GT)为负样本。那么,什么样的预测框我们可以把它判定为TP呢?答案是当矩形检测框与GT的IOU大于某一我们设定值(通常为0.5)时,我们判定该检测框为TP,则IOU小于等于设定值的检测框判定为FP,需要注意的是FP也包含同一GT的重复检测框。FN便是没有被检测框与其IOU大于设定值的GT数量。如表1所示。具体的例子看图2。
                   表1. 目标检测中TP、FP、FN的定义

属性含义
TPIOU>设定值的检测框数量
FPIOU<=设定值的检测框数量,也包含检测到同一GT的重复检测框数量
FN未被检测到的GT数量

在这里插入图片描述
         图2. 目标检测中TP、FP以及FN的判定方式示例(以行人为例)
那么对于数据集中某一特定类别的物体,我们统计出其在不同置信度的阈值下的TP、FP以及FN,并计算出相应的precision和recall,根据计算出的一系列的precision和recall,我们便可以绘制出该类别下的PR曲线,接下来计算PR曲线下的面积就得到了我们要的AP(注意:计算AP的方式有多种,下文会讲到

为什么要用mAP做评估指标

机器学习和深度学习模型中性能评估的几个重要参数有accuracy,precision和recall。目标检测器也是一样的,因为毕竟是一个领域里的。precision和recall是一个简单直观的统计量,但是在上文中我们也说了,目标检测中有所不同的是即使我们的目标检测器在图像中检测到物体,如果我们仍无法找到它所在的图像中的哪个位置也是无用的。由于我们需要预测图像中的目标的发生和位置,所以在计算precision和recall与普通的二分类有所不同(如上文描述的那样)。因此,在图像分类问题中所使用的标准度量不能直接应用于目标检测问题。在目标检测中的类别很多,因此我们要按照上边说的思路计算所有类别的AP,然后计算这些AP的平均值就得到了mAP。注意AP的计算方式,这是mAP的核心,下文讲解

mAP的计算方式

假设,对于图2中的行人类别,我们检测网络有以下输出(BB表示BoundingBox序号,设定IoU>0.5时Res=1,即被判定为TP):

BBconfidenceIOURes
10.90.61
20.90.81
10.80.91
30.70.30
40.70.40
50.70.71
60.70.30
70.70.10
80.70.91
90.70.61

因此,我们有 TP = 5 (BB1, BB2, BB5, BB8, BB9), FP=5 (重复检测到的BB1也算FP)。假设除了表里检测到的5个GT以外,我们还有2个GT没被检测到,因此FN = 2. 这时我们要计算不同阈值(confidence)下的precision和recall,而且confidence还要按照从高到低的顺序。 例如首先选取confidence=0.9,第一个检测框Res=1,判定为TP,此时总共预测了一个GT,而且预测正确,所以precision=1/(1+0) = 1;此时总共预测了一个GT,但是共有7个GT,所以recall=1/(5+2)=0.14。之后就可以按照Confidence从高到低的顺序给出各处的Precision和Recall的值,如下:

项目Value
电脑$1600
手机$12
导管$1
BBconfidenceIOUResprecisionrecall
10.90.611.000.14
20.90.811.000.29
10.80.910.660.29
30.70.300.500.29
40.70.400.400.29
50.70.710.500.43
60.70.300.430.43
70.70.100.380.43
80.70.910.440.57
90.70.610.500.71

根据我们计算出来的一组precision和recall的值,我们便可以绘制出PR曲线,从而计算出该类别下的AP值。
VOC2010之前计算AP的方法:
我们选取Recall >= 0, 0.1, 0.2,0.3,…, 1这11处Percision的最大值:1, 1, 1, 0.5, 0.5, 0.5, 0.5, 0.5, 0, 0, 0。此时该类别的 AP = 5.5 / 11 = 0.5
VOC2010及以后的方法:
对于Recall >= 0, 0.14, 0.29, 0.43, 0.57, 0.71, 1,我们选取此时Percision的最大值:1, 1, 1, 0.5, 0.5, 0.5, 0。此时该类别的 AP = (0.14-0)*1 + (0.29-0.14)*1 + (0.43-0.29)*0.5 + (0.57-0.43)*0.5 + (0.71-0.57)*0.5 + (1-0.71)*0 = 0.5
【敲黑板,数学基础薄弱的同学在此处回忆初学微积分时的场景,计算函数曲线下的面积】

mAP就是对每一个类别都计算出AP,然后再计算AP平均值就好了

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-04 15:33:38  更:2022-03-04 15:37:29 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 17:26:54-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码