https://discovery.ucl.ac.uk/id/eprint/1395202/1/Graepel_901%255B1%255D.pdf Prezentacja autora: Probabilistic Modeling and Inference at Scale — Ralf Herbrich (Part 1) https://www.youtube.com/watch?v=A2JinCdzpRM

Publikacja adresuje CTR, CVR prediction problem. Zaproponowany algorytm (adPredictor) oparty jest na Generalized Linear Model (GLM) i probit regression. Posterior aproksymują z wykorzystaniem message-passing. Inaczej, jest to Bayesian online learning probit regression.

Rozwiązanie zaproponowane w publikacji jest oparte o publikację TrueSkill A Bayesian Skill Rating System: cechy modelu są binarne, przyjmują tylko wartości 0 lub 1 - możemy przyjąć, że cechy to zawodnicy. Jeśli zawodnik “brał udział” w meczu, to cecha . W danym meczu (czyli w danym bid-requeście) do teamu wchodzą zawodnicy (cechy), których wartości . Dla każdego zawodnika (cechy) estymujemy score (wagę). Suma scorów (wag) to score teamu. Team (cechy bid requestu) gra przeciwko hipotetycznej drużynie, której score jest znany i równy 0. Wynikiem meczu jest “czy user kliknął”: jeśli kliknął, to wygrał team złożony z cech, jeśli nie kliknął, to wygrał “team zerowy”.

Powyższy opis wskazuje, że problem przewidywania klika jest mocno uproszczoną wersją oryginalnego TrueSkill, co pozwala analitycznie wyznaczyć wzór na update średniej i wariancji każdego zawodnika (cechy). Autorzy wprost te wzory podają.

Uwaga: ze wzorów np. (11) lub (2) to probit link function i pełni ona tylko rolę link function, tzn. przekłada wartości z w , tak jak sigmoid.

Jako metryki oceniającej używają Relative Infomation Gain i AUC