Online Bayesian Probit Regression

trochę teorii

Factor graph

::: block


TrueSkill

::: block (TrueSkill A Bayesian Skill Rating System; Ralf Herbrich, Tom Minka, Thore Graepel; Microsoft Research)

::: block

Skill gracza :


Performance gracza :


Performance drużyny :


- kto wygrał
- podział na drużyny


Cel

Estymowacja skilli graczy.


Factor graph dla TrueSkill

::: block

Weźmy 3 drużyny. Podział na drużyny : drużyna nr 1 ma tylko gracza nr 1, drużyna nr 2 ma graczy 2 i 3, drużyna nr 3 ma tylko gracza 4. - kto wygrał.



$$ \cdot \mathcal{N}(s_2;\mu_2,\sigma_2^2) \cdot \mathcal{N}(p_2; s_2,\beta^2) \cdot \mathcal{N}(s_3; \mu_3, \sigma_3^2) \cdot \mathbb{1}[t_1 = p_1] $$
$$ \ldots $$

Factor graph dla TrueSkill


Posterior

::: block

Celem jest policzenie posteriora:

Do tego używamy:

  • algorytm “Sum-product message passing”
  • algorytm “Expectation Propagation” (do aproksymacji)

Super wprowadzenie: gaussianbp.github.io


Co to ma do CTRa?

::: block = “slot == 007”; = “średni CTR usera < 0.1”


Jak wygląda realnie predykcja?


CatBoost + OBPR


Deep Learning + OBPR


Co wstawić w miejsce ”?”

::: block

  • twarde ?
  • LSH ?

  • losowanie z rozkładu BinConcrete1 (Gumbel-Max Trick), backpropagacja z wykorzystaniem wartości oczekiwanej funkcji straty, zmniejszanie temperatury wraz z trenowaniem tak, żeby w granicy wartości podawane do OBPR były binarne

::: block


Koniec

Footnotes

  1. The Concrete Distribution: A continuous relaxation of discrete random variables https://arxiv.org/pdf/1611.00712