TrueSkill A Bayesian Skill Rating System

https://proceedings.neurips.cc/paper/2006/file/f44ee263952e65b3610b8ba51229d1f9-Paper.pdf

Problem

Są rozgrywane mecze, skill drużyny w danym meczu to suma skilli graczy w drużynie w drużynie, skill gracza w danym meczu to sample z rozkładu normalnego wokół skilla gracza i ustalonej wariancji. Zadanie: muszą zaraportować skilla każdego gracza po skończonym meczu.

Rozwiązanie

Na początku zakładamy, że istnieje taki proces generujący wyniki meczu:

gracz $i$ ma skilla $s_{i}$ oraz $s_{i} \sim N (μ_{i}, σ_{i}^{2})$
gracz $i$ ma performance $p_{i}$ w danym meczu oraz $p_{i} \sim N (s_{i}, β^{2})$ gdzie $β$ jest stałe
performance $t_{j}$ teamu $j$ to suma performance graczy w danym teamie

Z meczu mamy outcome $r = (r_{1}, \dots, r_{k})$ gdzie $r_{1}$ to miejsce, które zajął team nr 1.

Zastanawiamy się jakie jest prawdopodobieństwo $P (s, p, t ∣ r, A)$ , czyli zastanawiamy się jakie jest rozkład prawdopodobieństwa $s$ , $p$ , $t$ gdy dany jest wynik meczu $r$ oraz podział na drużyny $A$ . Inaczej mówiąc, zastanawiamy się jakie wartości $s$ , $p$ , $t$ mogły wygenerować taki wynik meczu.

Końcowo chcemy wyliczyć posterior $P (s_{i} ∣ r, A)$ , co osiągamy poprzez marginalizację, tzn. $P (s_{i} ∣ r, A) = \int_{- \infty}^{+ \infty} \dots \int_{- \infty}^{+ \infty} P (s, p, t ∣ r, A) d p d t$ W jaki sposób policzyć tą marginalizację efektywnie? A no trzeba zapisać obliczenia jako Factor graph i użyć algorytmu Sum-product message passing, który powie nam jak policzyć to efektywnie.

Uwaga: tu jest założenie, że po nieskończonej liczbie meczy $σ_{i}$ zbiega do 0, tzn. algorytm zbiega odkrywając prawdziwe $s_{i}$ .

Publikacja oparta na A family of algorithms for approximate Bayesian inference oraz Factor graphs and the sum-product algorithm. Oparta o algorytm expectation propagation zaproponowany w publikacji A family of algorithms for approximate Bayesian inference.

TODO: Online learning algorithm: Gaussian density filtering (?) - posterior distribution jest przybliżany rozkładem normalnym i jest używany jako prior do następnego meczu.

W Update equations (1) $μ$ to $m$ , a $σ^{2}$ to $v^{2}$ !!

Quartz 4

Explorer

TrueSkill A Bayesian Skill Rating System

Problem

Rozwiązanie

Graph View

Table of Contents

Backlinks