跳至主要內容
分类任务的常见衡量指标

分类任务的常见衡量指标

TaoChenyue...大约 1 分钟

根据样本的不同,分类任务可以分为三种类型的任务:binary二类别分类,multiclass多类别分类,multilabel多标签分类

binary的样本和预测通常如下形式

target = tensor([0,1,0,1,0,1])
preds  = tensor([0.5,0.2,0.1,0.1,0.8,0.9])

multiclass的样本和预测通常如下形式

target = tensor([0, 1, 3, 2])
preds  = tensor([[0.75, 0.05, 0.05, 0.05, 0.05],
				[0.05, 0.75, 0.05, 0.05, 0.05],
				[0.05, 0.05, 0.75, 0.05, 0.05],
				[0.05, 0.05, 0.05, 0.75, 0.05]])

multilabel的样本和预测通常如下形式

target = tensor([[1, 0, 1],
                 [0, 0, 0],
                 [0, 1, 1],
                 [1, 1, 1]])
preds  = tensor([[0.75, 0.05, 0.35],
                [0.45, 0.75, 0.05],
                [0.05, 0.55, 0.75],
                [0.05, 0.65, 0.05]])

混淆矩阵

可以看出预测是以概率的形式表现的。对于二分类,假设有一个概率p,大于p的是预测为真,小于p的是预测为假。就可以得到下面这张表。

预测预测统计量
10
样本1TPTrue PositiveFNFalse NegativeTP/(TP+FN)召回率Recall,灵敏度Sensitivity,TPR
样本0FPFalse PositiveTNTrue NegativeTN/(FP+TN)特异度Specificity
FP/(FP+TN)FPR
统计量TP/(TP+FP)精确率Precision(TP+TN)/(TP+FP+TN+FN)正确率Accuracy
F1Score=2*Precision*Recall/(Precision+Recall)

ROC曲线(Reciever Operating Characterastic Curve)

通过改变概率p,可以得到不同的混淆矩阵,自然就可以得到不同的TPR和FPR。
以FPR为横轴,TPR为纵轴,(FPR,TPR)为坐标点,可以画出ROC曲线。

AUC(Area Under Curve)

ROC曲线下的面积。如果没有交点,AUC越大越好;如果有交点,要根据纵轴也就是灵敏度的需求,来判断好坏。

评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v2.15.8