IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【文本分类】多意图分类评估指标 -> 正文阅读

[人工智能]【文本分类】多意图分类评估指标

【文本分类】多意图分类评估指标

主要分为两类:label based measures和example based measures。

label based measures

就是针对每一个分类,都进行一次计算,最后再用一种average方法把多个分类统一起来。

假设有这么一组数据,

expected   predicted
A, C        A, B
C           C
A, B, C     B, C

用sklearn MultiLabelBinarizer 进行转化

expected    predicted
1 0 1       1 1 0
0 0 1       0 0 1
1 1 1       0 1 1

classA来说,

TP = 1(真实和预测都是1)

FP = 0(真实0,预测1)

TN = 1(真实0,预测0)

FN = 1(真实1,预测0)

TN   FP           1   0
FN   TP           1   1
precision = TP / (TP + FP) = 1 / (1+0) = 1
  
recall = TP / (TP + FN) = 1 / (1+1) = 0.5
  
f1-score = 2*p*r / (p+r) = 0.667

class B

TN   FP           1   1
FN   TP           0   1
Precision = 0.5

Recall = 1.0

F1-score = 0.667

class C

TN   FP           0   0
FN   TP           1   2
Precision = 1.0

Recall = 0.667

F1-score = 0.8
  • macro average

    Precision (macro avg)
    = (Precision of A + Precision of B + Precision of C) / 3
    = 0.833
    
  • micro average (preferred)

    Precision (micro avg)
    = sum(TP) / (sum(TP) + sum(FP))
    = 1+1+2 / ((1+1+2) + (0+1+0))
    = 0.8
    
  • weighted average

    Precision(weighted avg)
    = [(Precision of A * support A) + 
    (Precision of B * support B) + 
    (Precision of C * support C)] 
    / (support A + support B + support C)
    = (1*2 + 0.5*1 + 1*3) / 6
    = 0.9166
    
  • sample average
    第一行,真实 AC,预测 AB,precision 1/2 → 两个预测值中有一个是正确的

    第二行,真实 C,预测 C,precision 1

    第三行,真实 ABC,预测 BC,precision 1 → 预测的都是对的

    (1/2 + 1 + 1) / 3 = 5/6 = 0.833
    
  • classification_report
    直接用classification_report
    在这里插入图片描述

example based measures

计算每对真实与预测标签的average difference

  • hamming loss

    预测错了的label占总label的比例

  • subset accuracy

    也叫exact match ratio

    最严格的评估方法,真实和预测label必须完全一致,否则为0。这种方法忽略了部分正确的情况,在scikit-learn中的accuracy_score就是subset accuracy。

  • example-based accuracy

    预测正确的label占总label(预测为1和真实为1)的比例

  • example-based precision
    预测正确的label占总预测label的比例

参考来源

https://towardsdatascience.com/evaluating-multi-label-classifiers-a31be83da6ea Evaluating Multi-label Classifiers

https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff Deep dive into multi-label classification…! (With detailed Case Study)

https://medium.datadriveninvestor.com/a-survey-of-evaluation-metrics-for-multilabel-classification-bb16e8cd41cd Evaluation Metrics for Multi-Label Classification

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-09 18:22:35  更:2022-04-09 18:24:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 10:41:09-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码