国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

淺談torch中的softmax與CrossEntropy

2023-08-14 02:41 作者:momonaの男友  | 我要投稿

首先是softmax函數(shù),我認(rèn)為我在之前的文章

分類模型中為何更適合使用softmax函數(shù)?

已經(jīng)較為清楚的闡述,故這里不再重復(fù)贅述。


在上文中,我較為清晰的說明了,softmax函數(shù)只是為了將我們的預(yù)測(cè)結(jié)果,表達(dá)成一種合適的結(jié)果,去擬合one-hot編碼

但是對(duì)于這種向量標(biāo)簽,我們并不能很好的去定義其損失函數(shù)(誤差函數(shù))

我們理所當(dāng)然應(yīng)該想到均方誤差函數(shù),但實(shí)際上,均方誤差函數(shù)(MSE),對(duì)于標(biāo)量標(biāo)簽確實(shí)能起到一個(gè)非常好的效果。

而對(duì)于一個(gè)向量標(biāo)簽,我們選擇了一個(gè)能實(shí)現(xiàn)與之同等效果的CrossEntropy函數(shù),也即交叉熵?fù)p失函數(shù)。

交叉熵?fù)p失函數(shù)

如上圖所示,其中?y?為正確的標(biāo)簽,而 %5Chat%7By%7D 為預(yù)測(cè)標(biāo)簽(經(jīng)過softmax處理后)。

該損失函數(shù)在計(jì)算上具有非常明顯的便利性,即僅考慮正確標(biāo)簽下對(duì)應(yīng)的損失。例如,我們不妨令?y = [0, 1, 0],%5Chat%7By%7D%20 = [0.3, 0.1, 0.6], 那么此時(shí)的?loss%20%3D%20-0log0.3-1log0.1-0log0.6%3D-log0.1?,

即僅考慮到了正確標(biāo)簽下的損失。

而其優(yōu)越性不僅表現(xiàn)在此處,其導(dǎo)函數(shù)更是有非常優(yōu)異的性質(zhì),即:

CrossEntropy函數(shù)的導(dǎo)函數(shù)

其中?o?為未經(jīng)softmax處理前得到的預(yù)測(cè)標(biāo)簽。

換言之,%CE%B4_%7Bo%7D(y%2C%20%5Chat%7By%7D%20%20)%20%20%3D%20%5Chat%7By%7D-y

如下圖所示:

驗(yàn)證如上結(jié)論

毫無疑問,y_pred.grad == softmax(y_pred) - one_hot(y),這是成立的。(不成立可能是精度誤差導(dǎo)致的,看圖中明顯成立)。

而觀察y_pred.grad,對(duì)于y[1]這個(gè)樣本,我們明顯可以看出,其梯度是正在減少前兩項(xiàng)的權(quán)值,而增大最后一項(xiàng)的權(quán)值,以努力實(shí)現(xiàn)正確歸類至第三類,這是符合我們預(yù)期的。

故,CrossEntropy函數(shù)確實(shí)是在朝著我們的目標(biāo)去實(shí)現(xiàn)。

淺談torch中的softmax與CrossEntropy的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
成武县| 七台河市| 亚东县| 古蔺县| 新建县| 固原市| 乌拉特前旗| 永福县| 永胜县| 阳高县| 高碑店市| 江山市| 江北区| 昌江| 疏附县| 长沙县| 蓝山县| 安化县| 定远县| 宜城市| 三明市| 郯城县| 扎兰屯市| 淮滨县| 怀仁县| 巨野县| 班玛县| 通江县| 仙居县| 扎鲁特旗| 营山县| 绿春县| 巩义市| 应城市| 洛隆县| 凤翔县| 张家港市| 汝州市| 大安市| 霍山县| 建水县|