基础概念
- 真正例TP(true positive)
- 假正例FP(false positive)
- 真反例TN(true negative)
- 假反例FN(false negative)
二分类
混淆矩阵:
真实情况\预测结果 | 正例 | 反例 |
---|
正例 | TP(真正例) | FN(假反例) | 反例 | FP(假正例) | TN(真反例) |
- 根据上表显然有
T
P
+
F
P
+
T
N
+
F
N
=
样
例
总
数
TP+FP+TN+FN=样例总数
TP+FP+TN+FN=样例总数
准确率(Accuracy)
A
=
T
P
+
T
N
T
P
+
F
N
+
F
P
+
T
N
A={TP+TN \over TP+FN+FP+TN}
A=TP+FN+FP+TNTP+TN?
查准率/精度(Precision)
P
=
T
P
T
P
+
F
P
P={TP \over TP+FP}
P=TP+FPTP?
查全率/检出率(Recall)
R
=
T
P
T
P
+
F
N
R={TP \over TP+FN}
R=TP+FNTP?
- 在所有原本就是正例的样本中,预测出也为正例的样本所占的比例
F1-score
F
1
=
2
?
P
?
R
P
+
R
=
2
?
T
P
样
例
总
数
+
T
P
?
T
N
F1={2*P*R \over P+R}={2*TP \over 样例总数+TP-TN}
F1=P+R2?P?R?=样例总数+TP?TN2?TP?
- F1是基于查准率和查全率的调和平均,定义为:
1
F
1
=
1
2
?
(
1
P
+
1
R
)
{1 \over F1}={1 \over 2}*({1 \over P}+{1 \over R})
F11?=21??(P1?+R1?)
真正例率(True Positive Rate)
T
P
R
=
T
P
T
P
+
F
N
TPR={TP \over TP+FN}
TPR=TP+FNTP?
- 在所有原本为正例的样本中,检测出来的正例所占的比例
假正例率(False Positive Rate)
F
P
R
=
F
P
T
N
+
F
P
FPR={FP \over TN+FP}
FPR=TN+FPFP?
- 在所有原来为反例的样本中,被检测出来的为正例所占的比例
ROC曲线 真正例率为纵轴,假正例率为横轴
多分类
多分类的混淆矩阵:
真实情况\预测结果 | 类1 | 类2 | 类3 | 类j |
---|
类1 |
n
11
n_{11}
n11? |
n
12
n_{12}
n12? |
n
13
n_{13}
n13? |
n
1
j
n_{1j}
n1j? | 类2 |
n
21
n_{21}
n21? |
n
22
n_{22}
n22? |
n
23
n_{23}
n23? |
n
2
j
n_{2j}
n2j? | 类3 |
n
31
n_{31}
n31? |
n
32
n_{32}
n32? |
n
33
n_{33}
n33? |
n
3
j
n_{3j}
n3j? | 类 i |
n
i
1
n_{i1}
ni1? |
n
i
2
n_{i2}
ni2? |
n
i
3
n_{i3}
ni3? |
n
i
j
n_{ij}
nij? |
其中i和j的最大值相同为k
准确率(Accuracy)
A
=
∑
i
=
1
k
n
i
i
∑
i
=
1
k
∑
j
=
1
k
n
i
j
A={\sum_{i=1}^{k}{n_{ii}} \over \sum_{i=1}^{k}\sum_{j=1}^{k}n_{ij}}
A=∑i=1k?∑j=1k?nij?∑i=1k?nii??
查准率/精度(Precision)
P
=
n
j
j
∑
i
=
1
n
n
i
j
P={n_{jj} \over \sum_{i=1}^{n}n_{ij}}
P=∑i=1n?nij?njj??
查全率/检出率(Recall)
R
=
n
i
i
∑
j
=
1
n
n
i
j
R={n_{ii} \over \sum_{j=1}^{n}n_{ij}}
R=∑j=1n?nij?nii??
真正例率(True Positive Rate)
T
P
R
=
n
j
j
∑
i
=
1
n
n
i
j
TPR={n_{jj} \over \sum_{i=1}^{n}n_{ij}}
TPR=∑i=1n?nij?njj??
- 计算方式同查准率,在所有原本为该例的样本中,检测出来为该例的所占的比例
假正例率(False Positive Rate)
F
P
R
=
第
i
列
的
和
?
n
i
i
所
有
样
例
数
?
该
例
数
FPR={第i列的和-n_{ii} \over 所有样例数-该例数}
FPR=所有样例数?该例数第i列的和?nii??
- 在所有原来为非该例的样本中,被检测出来的为该例所占的比例
|