最全的損失函數(shù)匯總

發(fā)布人：數(shù)據(jù)派THU 時(shí)間：2022-07-23 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

19種損失函數(shù)

1. L1范數(shù)損失 L1Loss

計(jì)算 output 和 target 之差的絕對(duì)值。

torch.nn.L1Loss(reduction='mean')

參數(shù)：

reduction-三個(gè)值，none: 不使用約簡(jiǎn)；mean:返回loss和的平均值；sum:返回loss的和。默認(rèn)：mean。

2 均方誤差損失 MSELoss
計(jì)算 output 和 target 之差的均方差。

torch.nn.MSELoss(reduction='mean')

參數(shù)：

reduction-三個(gè)值，none: 不使用約簡(jiǎn)；mean:返回loss和的平均值；sum:返回loss的和。默認(rèn)：mean。

3 交叉熵?fù)p失 CrossEntropyLoss
當(dāng)訓(xùn)練有 C 個(gè)類(lèi)別的分類(lèi)問(wèn)題時(shí)很有效. 可選參數(shù) weight 必須是一個(gè)1維 Tensor, 權(quán)重將被分配給各個(gè)類(lèi)別. 對(duì)于不平衡的訓(xùn)練集非常有效。
在多分類(lèi)任務(wù)中，經(jīng)常采用 softmax 激活函數(shù)+交叉熵?fù)p失函數(shù)，因?yàn)榻徊骒孛枋隽藘蓚€(gè)概率分布的差異，然而神經(jīng)網(wǎng)絡(luò)輸出的是向量，并不是概率分布的形式。所以需要 softmax激活函數(shù)將一個(gè)向量進(jìn)行“歸一化”成概率分布的形式，再采用交叉熵?fù)p失函數(shù)計(jì)算 loss。

torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')

參數(shù)：

weight (Tensor, optional) – 自定義的每個(gè)類(lèi)別的權(quán)重. 必須是一個(gè)長(zhǎng)度為 C 的 Tensorignore_index (int, optional) – 設(shè)置一個(gè)目標(biāo)值, 該目標(biāo)值會(huì)被忽略, 從而不會(huì)影響到輸入的梯度。reduction-三個(gè)值，none: 不使用約簡(jiǎn)；mean:返回loss和的平均值；sum:返回loss的和。默認(rèn)：mean。

4 KL 散度損失 KLDivLoss
計(jì)算 input 和 target 之間的 KL 散度。KL 散度可用于衡量不同的連續(xù)分布之間的距離, 在連續(xù)的輸出分布的空間上(離散采樣)上進(jìn)行直接回歸時(shí) 很有效.

torch.nn.KLDivLoss(reduction='mean')

參數(shù)：

reduction-三個(gè)值，none: 不使用約簡(jiǎn)；mean:返回loss和的平均值；sum:返回loss的和。默認(rèn)：mean。

5 二進(jìn)制交叉熵?fù)p失 BCELoss
二分類(lèi)任務(wù)時(shí)的交叉熵計(jì)算函數(shù)。用于測(cè)量重構(gòu)的誤差, 例如自動(dòng)編碼機(jī). 注意目標(biāo)的值 t[i] 的范圍為0到1之間.

torch.nn.BCELoss(weight=None, reduction='mean')

參數(shù)：

weight (Tensor, optional) – 自定義的每個(gè) batch 元素的 loss 的權(quán)重. 必須是一個(gè)長(zhǎng)度為 “nbatch” 的的 Tensor

6 BCEWithLogitsLoss
BCEWithLogitsLoss損失函數(shù)把 Sigmoid 層集成到了 BCELoss 類(lèi)中. 該版比用一個(gè)簡(jiǎn)單的 Sigmoid 層和 BCELoss 在數(shù)值上更穩(wěn)定, 因?yàn)榘堰@兩個(gè)操作合并為一個(gè)層之后, 可以利用 log-sum-exp 的技巧來(lái)實(shí)現(xiàn)數(shù)值穩(wěn)定.

torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)

參數(shù)：

weight (Tensor, optional) – 自定義的每個(gè) batch 元素的 loss 的權(quán)重. 必須是一個(gè)長(zhǎng)度為 “nbatch” 的 Tensor

7 MarginRankingLoss

torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')

對(duì)于 mini-batch(小批量) 中每個(gè)實(shí)例的損失函數(shù)如下:

參數(shù)：

margin:默認(rèn)值0

8 HingeEmbeddingLoss

torch.nn.HingeEmbeddingLoss(margin=1.0,  reduction='mean')

對(duì)于 mini-batch(小批量) 中每個(gè)實(shí)例的損失函數(shù)如下:

參數(shù)：

margin:默認(rèn)值1

9 多標(biāo)簽分類(lèi)損失 MultiLabelMarginLoss

torch.nn.MultiLabelMarginLoss(reduction='mean')

對(duì)于mini-batch(小批量) 中的每個(gè)樣本按如下公式計(jì)算損失:

10 平滑版L1損失 SmoothL1Loss

也被稱(chēng)為 Huber 損失函數(shù)。

torch.nn.SmoothL1Loss(reduction='mean')

其中

11 2分類(lèi)的logistic損失 SoftMarginLoss

torch.nn.SoftMarginLoss(reduction='mean')

12 多標(biāo)簽 one-versus-all 損失 MultiLabelSoftMarginLoss

torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')

13 cosine 損失 CosineEmbeddingLoss

torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')

參數(shù)：

margin:默認(rèn)值0

14 多類(lèi)別分類(lèi)的hinge損失 MultiMarginLoss

torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None,  reduction='mean'

參數(shù)：

p=1或者2 默認(rèn)值：1
margin:默認(rèn)值1

15 三元組損失 TripletMarginLoss

和孿生網(wǎng)絡(luò)相似，具體例子：給一個(gè)A，然后再給B、C，看看B、C誰(shuí)和A更像。

torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')

其中：

16 連接時(shí)序分類(lèi)損失 CTCLoss
CTC連接時(shí)序分類(lèi)損失，可以對(duì)沒(méi)有對(duì)齊的數(shù)據(jù)進(jìn)行自動(dòng)對(duì)齊，主要用在沒(méi)有事先對(duì)齊的序列化數(shù)據(jù)訓(xùn)練上。比如語(yǔ)音識(shí)別、ocr識(shí)別等等。

torch.nn.CTCLoss(blank=0, reduction='mean')

參數(shù)：

reduction-三個(gè)值，none: 不使用約簡(jiǎn)；mean:返回loss和的平均值；sum:返回loss的和。默認(rèn)：mean。

17 負(fù)對(duì)數(shù)似然損失 NLLLoss
負(fù)對(duì)數(shù)似然損失. 用于訓(xùn)練 C 個(gè)類(lèi)別的分類(lèi)問(wèn)題。

torch.nn.NLLLoss(weight=None, ignore_index=-100,  reduction='mean')

參數(shù)：

weight (Tensor, optional) – 自定義的每個(gè)類(lèi)別的權(quán)重. 必須是一個(gè)長(zhǎng)度為 C 的 Tensorignore_index (int, optional) – 設(shè)置一個(gè)目標(biāo)值, 該目標(biāo)值會(huì)被忽略, 從而不會(huì)影響到輸入的梯度.

18 NLLLoss2d
對(duì)于圖片輸入的負(fù)對(duì)數(shù)似然損失. 它計(jì)算每個(gè)像素的負(fù)對(duì)數(shù)似然損失。

torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')

參數(shù)：

weight (Tensor, optional) – 自定義的每個(gè)類(lèi)別的權(quán)重. 必須是一個(gè)長(zhǎng)度為 C 的 Tensorreduction-三個(gè)值，none: 不使用約簡(jiǎn)；mean:返回loss和的平均值；sum:返回loss的和。默認(rèn)：mean。

19 PoissonNLLLoss
目標(biāo)值為泊松分布的負(fù)對(duì)數(shù)似然損失。

torch.nn.PoissonNLLLoss(log_input=True, full=False,  eps=1e-08,  reduction='mean')

參數(shù)：

log_input (bool, optional) – 如果設(shè)置為 True , loss 將會(huì)按照公式 exp(input) - target * input 來(lái)計(jì)算, 如果設(shè)置為 False , loss 將會(huì)按照 input - target * log(input+eps) 計(jì)算。

full (bool, optional) – 是否計(jì)算全部的 loss, i. e. 加上 Stirling 近似項(xiàng) target * log(target) - target + 0.5 * log(2 * pi * target)。

eps (float, optional) – 默認(rèn)值: 1e-8。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專(zhuān)欄

最全的損失函數(shù)匯總

相關(guān)推薦

技術(shù)專(zhuān)區(qū)