Brier score
Dekompozycja
Brier Score można zapisać jako gdzie
Uncertainty
UNC=s (1-s)$$$$s = \frac{\sum_i outcome_i}{N} Czyli w przypadku CTR, CVR prediction problem to empiryczny CTR. mierzy jak łatwo jest przewidywać - jeśli jest niski, czyli jest bliski 0 lub 1, to niepewność jest niska, bo wystarczy dawać jako forecast zawsze 0 lub 1 i będą dobre wyniki.
Uwaga: Uncertainty zależy tylko od outcome, nie od predykcji; jest charakterystyką problemu.
Resolution
Chcielibyśmy nie dawać cały czas takiej samej odpowiedzi, tylko tam gdzie p-stwo jest wysokie to predykcja wysoka, a gdzie p-stwo niskie tam predykcja niska. Patrzymy więc na predykcje, dzielimy predykcje na kubełki (kwantyle). W kubełku liczymy rzeczywisty CTR () i odnosimy to do globalnego rzeczywistego CTRa (). Jeśli nasze predykcje będą dobre to będzie się znacznie różniło do , więc będzie duże. Jeśli będziemy predykować zawsze to samo, to i .
Reliability
Tak jak w Resolution, dzielimy predykcje na kubełki. Dla każdego kubełka liczymy średnią predykcję i średni rzeczywisty CTR: + wagujemy jeszcze po wielkości kubełka. Reliability wyraża to samo co Expected Calibration Error, tylko ECE zamiast kwadratu robi wartość abolutną.