圖像分類的5種評(píng)價(jià)指標(biāo)詳解!附代碼實(shí)例
來源:投稿 作者:AI浩
編輯:學(xué)姐
摘要
一般情況來說,單一評(píng)分標(biāo)準(zhǔn)無法完全評(píng)估一個(gè)機(jī)器學(xué)習(xí)模型。只用good和bad偏離真實(shí)場(chǎng)景去評(píng)估某個(gè)模型,都是一種欠妥的評(píng)估方式。單標(biāo)簽分類的評(píng)價(jià)指標(biāo)有:混淆矩陣,準(zhǔn)確率(Accuracy),精確率(Precision),召回率(Recall),F(xiàn)1-score,ROC曲線和AUC。
1、混淆矩陣
TP
:正樣本且分類為正樣本的數(shù)目為(True Positive)FN
:標(biāo)簽為正樣本分類為負(fù)樣本的數(shù)目(Flase Negative)FP
:標(biāo)簽是負(fù)樣本分類為正樣本的數(shù)目(Flase Positive)TN
:標(biāo)簽是負(fù)樣本且分類為負(fù)樣本的數(shù)目(True Negative)
第一種混淆矩陣:

第二種混淆矩陣:

2、準(zhǔn)確率(Accuracy)
準(zhǔn)確率(Accuracy)是最常用的指標(biāo),指的是分類正確的樣本數(shù)占樣本總數(shù)的比例,公式如下:

通俗的解釋就是在所有樣本中,預(yù)測(cè)正確的概率。
在實(shí)際使用中,我們還能經(jīng)??吹紸CC1和ACC5,分別是:
top1_acc
就是說只有真實(shí)標(biāo)簽是預(yù)測(cè)出的概率最高的類,才算預(yù)測(cè)正確。top5_acc
就是說只要真實(shí)標(biāo)簽是預(yù)測(cè)出的概率最高的5個(gè)類之一,就算預(yù)測(cè)正確。
3、精確率(Precision)
預(yù)測(cè)出為陽性的樣本中,正確的有多少。區(qū)別準(zhǔn)確率(正確預(yù)測(cè)出的樣本,包括正確預(yù)測(cè)為陽性、陰性,占總樣本比例),又稱查準(zhǔn)率。公式如下:

通俗的解釋就是正樣本中,預(yù)測(cè)正確的概率。
需要注意的是, Precision
和 Accuracy
是不一樣的,Accuracy 針對(duì)所有樣本,而 Precision 僅針對(duì)檢測(cè)出來(包括誤檢)的那一部分樣本。
4、召回率(Recall)
正確預(yù)測(cè)為陽性的數(shù)量占總樣本中陽性數(shù)量的比例,又稱查全率。
例,在所有實(shí)際上有惡性腫瘤的病人中,成功預(yù)測(cè)有惡性腫瘤的病人的百分比,越高越好。

通俗的解釋就是正樣本被找到的概率。
5、F1-score
F1分?jǐn)?shù)(F1-score)是分類問題的一個(gè)衡量指標(biāo)。一些多分類問題的機(jī)器學(xué)習(xí)競(jìng)賽,常常將F1-score作為最終測(cè)評(píng)的方法。它是精確率和召回率的調(diào)和平均數(shù),最大為1,最小為0。

6、代碼樣例
我在使用的sklearn
里面的classification_report
實(shí)現(xiàn)Precison、Recall、F1的計(jì)算,代碼如下:
運(yùn)行效果!

關(guān)注【學(xué)姐帶你玩AI】公眾號(hào)
回復(fù)“CVPR”獲取500+篇頂會(huì)必讀論文!