- model per kampania
1 model do wyborukmapnii (rankingu) - prosty - liniowy 2 model (skomplikowany) do wyceny
Karol:
- liczą macierzowo
- mogliby douczać co 2 minuty, ale obecnie liczą od początku
- potrzebują tylko ranking, a nie precyzyjną wycenę
Kamil obawia się, że mają model per kampania na wzór rozwiązania Karola, to modele będą nieskalibrowane.
3 warstwy wyceny:
- target grupy - wycięcie dużej części przestrzeni do wyceny
- wybór kampanii - bandyci + thomposon sampling
- wycena kampanii - bandyci, tj. statystyka per przecięcie
Ad. 2 wymagania:
- szybkie (=proste)
- rozkład, pozwalający samplować
- ogranie cold startu
- douczanie się
Propozycje:
- model per kampania
- model ogólny
| model | eksploracja | wynik | jeden / wiele modeli | cold start w ramach jednego modelu | cechy | online | ||
|---|---|---|---|---|---|---|---|---|
| bandyci | statystyka per przecięcie | TS | p-stwo | 0 / 1 | - | categorical | TAK | |
| Ad Click Prediction a View from the Trenches | regresja logistyczna | prawdopodobnie przez UCB | p-stwo | 1 / 0 | TAK | dowolne | TAK (gradient descent, single-pass) | |
| A Contextual-Bandit Approach to Personalized News Article Recommendation (LinUCB) | model liniowy (NIE regresja logistyczna) | UCB | ranking | 1 / 1 | - | dowolne | tutaj A Contextual-Bandit Approach to Personalized News Article Recommendation (sekcja 3.1, poniżej wzoru (5), że możemy mieć rozkład normalny z policzoną średnią i wariancją) - moglibyśmy więc samplować, ale wciąż nie jest to regresja logistyczna | |
| Bayesian | regresja logistyczna | TS | p-stwo | 1 / 1 | TAK | binarne | TAK (custom wzór, single-pass), szybkie | |
| Krzysiek | regresja logistyczna | TS | p-stwo | 1 / 1 | ? | dowolne | ? | |
| https://github.com/adtech-labs/bayes_logistic/tree/master | regresja logistyczna | TS | p-stwo | 1 / 1 | ? | dowolne | TAK | https://www.youtube.com/watch?v=W2ILJQu5L1Q if w = 0 and converiance matrix was diagonal with identical values, then the problem would reduce to L2 regularized logistic regression. diagonal Hessian - useful for large problems + możemy policzyć p-value i stwierdzić czy waga istotnie różni się od 0 |
Krzysiek:
- potencjalnie probelym numeryczne
- nie wiemy jak szybko się uczy
- update per pojedyncze x, żeby mieć update batchowy to trzeba coś doimplementować
- wyraz wolny musi podać użytkownik!
nie wiem z czego wynika konkretny update!! mu i sigma (sigma)
https://www.cse.wustl.edu/~garnett/cse515t/fall_2024/files/lecture_notes/9.pdf ← ładnie opisane skąd i jak Laplace approximation w logistic regression
Sherman-Morisson to nie jest przybliżenie, jest to dokładny wzór. Ale uwaga: nie jest znane numeryczna stabilność tego algorytmu (tak mówi wikipedia, i w dodatku wskazuje, że anegdotyczne dowód jest taki, że to może być niestabilne).