博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 最全的損失函數(shù)匯總

最全的損失函數(shù)匯總

發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2022-07-23 來(lái)源:工程師 發(fā)布文章
19種損失函數(shù)

1. L1范數(shù)損失 L1Loss


計(jì)算 output 和 target 之差的絕對(duì)值。


torch.nn.L1Loss(reduction='mean')

參數(shù):

reduction-三個(gè)值,none: 不使用約簡(jiǎn);mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。


2 均方誤差損失 MSELoss
計(jì)算 output 和 target 之差的均方差。


torch.nn.MSELoss(reduction='mean')

參數(shù):

reduction-三個(gè)值,none: 不使用約簡(jiǎn);mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。


3 交叉熵?fù)p失 CrossEntropyLoss
當(dāng)訓(xùn)練有 C 個(gè)類(lèi)別的分類(lèi)問(wèn)題時(shí)很有效. 可選參數(shù) weight 必須是一個(gè)1維 Tensor, 權(quán)重將被分配給各個(gè)類(lèi)別. 對(duì)于不平衡的訓(xùn)練集非常有效。
在多分類(lèi)任務(wù)中,經(jīng)常采用 softmax 激活函數(shù)+交叉熵?fù)p失函數(shù),因?yàn)榻徊骒孛枋隽藘蓚€(gè)概率分布的差異,然而神經(jīng)網(wǎng)絡(luò)輸出的是向量,并不是概率分布的形式。所以需要 softmax激活函數(shù)將一個(gè)向量進(jìn)行“歸一化”成概率分布的形式,再采用交叉熵?fù)p失函數(shù)計(jì)算 loss。

圖片


torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')

參數(shù):

weight (Tensor, optional) – 自定義的每個(gè)類(lèi)別的權(quán)重. 必須是一個(gè)長(zhǎng)度為 C 的 Tensorignore_index (int, optional) – 設(shè)置一個(gè)目標(biāo)值, 該目標(biāo)值會(huì)被忽略, 從而不會(huì)影響到 輸入的梯度。reduction-三個(gè)值,none: 不使用約簡(jiǎn);mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。


4 KL 散度損失 KLDivLoss
計(jì)算 input 和 target 之間的 KL 散度。KL 散度可用于衡量不同的連續(xù)分布之間的距離, 在連續(xù)的輸出分布的空間上(離散采樣)上進(jìn)行直接回歸時(shí) 很有效.


torch.nn.KLDivLoss(reduction='mean')

參數(shù):

reduction-三個(gè)值,none: 不使用約簡(jiǎn);mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。


5 二進(jìn)制交叉熵?fù)p失 BCELoss
二分類(lèi)任務(wù)時(shí)的交叉熵計(jì)算函數(shù)。用于測(cè)量重構(gòu)的誤差, 例如自動(dòng)編碼機(jī). 注意目標(biāo)的值 t[i] 的范圍為0到1之間.


torch.nn.BCELoss(weight=None, reduction='mean')

參數(shù):

weight (Tensor, optional) – 自定義的每個(gè) batch 元素的 loss 的權(quán)重. 必須是一個(gè)長(zhǎng)度為 “nbatch” 的 的 Tensor


6 BCEWithLogitsLoss
BCEWithLogitsLoss損失函數(shù)把 Sigmoid 層集成到了 BCELoss 類(lèi)中. 該版比用一個(gè)簡(jiǎn)單的 Sigmoid 層和 BCELoss 在數(shù)值上更穩(wěn)定, 因?yàn)榘堰@兩個(gè)操作合并為一個(gè)層之后, 可以利用 log-sum-exp 的 技巧來(lái)實(shí)現(xiàn)數(shù)值穩(wěn)定.


torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)

參數(shù):

weight (Tensor, optional) – 自定義的每個(gè) batch 元素的 loss 的權(quán)重. 必須是一個(gè)長(zhǎng)度 為 “nbatch” 的 Tensor


7 MarginRankingLoss



torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')


對(duì)于 mini-batch(小批量) 中每個(gè)實(shí)例的損失函數(shù)如下:
圖片
參數(shù):

margin:默認(rèn)值0

8 HingeEmbeddingLoss



torch.nn.HingeEmbeddingLoss(margin=1.0,  reduction='mean')

對(duì)于 mini-batch(小批量) 中每個(gè)實(shí)例的損失函數(shù)如下:
圖片

參數(shù):

margin:默認(rèn)值1


9 多標(biāo)簽分類(lèi)損失 MultiLabelMarginLoss



torch.nn.MultiLabelMarginLoss(reduction='mean')

對(duì)于mini-batch(小批量) 中的每個(gè)樣本按如下公式計(jì)算損失:
圖片

10 平滑版L1損失 SmoothL1Loss


也被稱(chēng)為 Huber 損失函數(shù)。


torch.nn.SmoothL1Loss(reduction='mean')
圖片
其中圖片

11 2分類(lèi)的logistic損失 SoftMarginLoss



torch.nn.SoftMarginLoss(reduction='mean')
圖片


12 多標(biāo)簽 one-versus-all 損失 MultiLabelSoftMarginLoss



torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')
圖片

13 cosine 損失 CosineEmbeddingLoss



torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')
圖片

參數(shù):

margin:默認(rèn)值0


14 多類(lèi)別分類(lèi)的hinge損失 MultiMarginLoss



torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None,  reduction='mean'

圖片

參數(shù):

p=1或者2 默認(rèn)值:1
margin:默認(rèn)值1


15 三元組損失 TripletMarginLoss


和孿生網(wǎng)絡(luò)相似,具體例子:給一個(gè)A,然后再給B、C,看看B、C誰(shuí)和A更像。


圖片


torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')
圖片

其中:圖片

16 連接時(shí)序分類(lèi)損失 CTCLoss
CTC連接時(shí)序分類(lèi)損失,可以對(duì)沒(méi)有對(duì)齊的數(shù)據(jù)進(jìn)行自動(dòng)對(duì)齊,主要用在沒(méi)有事先對(duì)齊的序列化數(shù)據(jù)訓(xùn)練上。比如語(yǔ)音識(shí)別、ocr識(shí)別等等。

torch.nn.CTCLoss(blank=0, reduction='mean')

參數(shù):

reduction-三個(gè)值,none: 不使用約簡(jiǎn);mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。


17 負(fù)對(duì)數(shù)似然損失 NLLLoss
負(fù)對(duì)數(shù)似然損失. 用于訓(xùn)練 C 個(gè)類(lèi)別的分類(lèi)問(wèn)題。


torch.nn.NLLLoss(weight=None, ignore_index=-100,  reduction='mean')

參數(shù):

weight (Tensor, optional) – 自定義的每個(gè)類(lèi)別的權(quán)重. 必須是一個(gè)長(zhǎng)度為 C 的 Tensorignore_index (int, optional) – 設(shè)置一個(gè)目標(biāo)值, 該目標(biāo)值會(huì)被忽略, 從而不會(huì)影響到 輸入的梯度.


18 NLLLoss2d
對(duì)于圖片輸入的負(fù)對(duì)數(shù)似然損失. 它計(jì)算每個(gè)像素的負(fù)對(duì)數(shù)似然損失。


torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')

參數(shù):

weight (Tensor, optional) – 自定義的每個(gè)類(lèi)別的權(quán)重. 必須是一個(gè)長(zhǎng)度為 C 的 Tensorreduction-三個(gè)值,none: 不使用約簡(jiǎn);mean:返回loss和的平均值;sum:返回loss的和。默認(rèn):mean。


19 PoissonNLLLoss
目標(biāo)值為泊松分布的負(fù)對(duì)數(shù)似然損失。


torch.nn.PoissonNLLLoss(log_input=True, full=False,  eps=1e-08,  reduction='mean')

參數(shù):

log_input (bool, optional) – 如果設(shè)置為 True , loss 將會(huì)按照公 式 exp(input) - target * input 來(lái)計(jì)算, 如果設(shè)置為 False , loss 將會(huì)按照 input - target * log(input+eps) 計(jì)算。

full (bool, optional) – 是否計(jì)算全部的 loss, i. e. 加上 Stirling 近似項(xiàng) target * log(target) - target + 0.5 * log(2 * pi * target)。

eps (float, optional) – 默認(rèn)值: 1e-8。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉