Brier skill score

Brier score

$BS = \frac{1}{N} \sum_{i} (p re d i c t i o n_{i} - o u t co m e_{i})^{2}$

Dekompozycja

Brier Score można zapisać jako $BS = U NC + RE L - RES$ gdzie

Uncertainty

$UNC=s (1-s)$$$$s = \frac{\sum_i outcome_i}{N}$ Czyli w przypadku CTR, CVR prediction problem $s$ to empiryczny CTR. $U NC$ mierzy jak łatwo jest przewidywać - jeśli $U NC$ jest niski, czyli $s$ jest bliski 0 lub 1, to niepewność jest niska, bo wystarczy dawać jako forecast zawsze 0 lub 1 i będą dobre wyniki.

Uwaga: Uncertainty zależy tylko od outcome, nie od predykcji; jest charakterystyką problemu.

Resolution

Chcielibyśmy nie dawać cały czas takiej samej odpowiedzi, tylko tam gdzie p-stwo jest wysokie to predykcja wysoka, a gdzie p-stwo niskie tam predykcja niska. Patrzymy więc na predykcje, dzielimy predykcje na kubełki (kwantyle). W kubełku $k$ liczymy rzeczywisty CTR ( $s_{k}$ ) i odnosimy to do globalnego rzeczywistego CTRa ( $s$ ). $RES = \sum_{k} (s_{k} - s)^{2}$ Jeśli nasze predykcje będą dobre to $s_{k}$ będzie się znacznie różniło do $s$ , więc $RES$ będzie duże. Jeśli będziemy predykować zawsze to samo, to $s_{k} = s$ i $RES = 0$ .

Reliability

Tak jak w Resolution, dzielimy predykcje na kubełki. Dla każdego kubełka liczymy średnią predykcję i średni rzeczywisty CTR: $RE L = \sum_{k} (\frac{\sum _{i \in k} p re d i c t i o n _{i}}{N _{k}} - s_{k})^{2}$ + wagujemy jeszcze po wielkości kubełka. Reliability wyraża to samo co Expected Calibration Error, tylko ECE zamiast kwadratu robi wartość abolutną.

Źródło: Brier score composition – A mini-tutorial

metryka

Quartz 4

Explorer

Brier skill score

Brier score

Dekompozycja

Uncertainty

Resolution

Reliability

Graph View

Table of Contents

Backlinks