1. model per kampania

1 model do wyborukmapnii (rankingu) - prosty - liniowy 2 model (skomplikowany) do wyceny

Karol:

  • liczą macierzowo
  • mogliby douczać co 2 minuty, ale obecnie liczą od początku
  • potrzebują tylko ranking, a nie precyzyjną wycenę

Kamil obawia się, że mają model per kampania na wzór rozwiązania Karola, to modele będą nieskalibrowane.

3 warstwy wyceny:

  1. target grupy - wycięcie dużej części przestrzeni do wyceny
  2. wybór kampanii - bandyci + thomposon sampling
  3. wycena kampanii - bandyci, tj. statystyka per przecięcie

Ad. 2 wymagania:

  • szybkie (=proste)
  • rozkład, pozwalający samplować
  • ogranie cold startu
  • douczanie się

Propozycje:

  1. model per kampania
  2. model ogólny
modeleksploracjawynikjeden / wiele modelicold start w ramach jednego modelucechyonline
bandycistatystyka per przecięcieTSp-stwo0 / 1-categoricalTAK
Ad Click Prediction a View from the Trenchesregresja logistycznaprawdopodobnie przez UCBp-stwo1 / 0TAKdowolneTAK (gradient descent, single-pass)
A Contextual-Bandit Approach to Personalized News Article Recommendation (LinUCB)model liniowy (NIE regresja logistyczna)UCBranking1 / 1-dowolnetutaj A Contextual-Bandit Approach to Personalized News Article Recommendation (sekcja 3.1, poniżej wzoru (5), że możemy mieć rozkład normalny z policzoną średnią i wariancją) - moglibyśmy więc samplować, ale wciąż nie jest to regresja logistyczna
Bayesianregresja logistycznaTSp-stwo1 / 1TAKbinarneTAK (custom wzór, single-pass), szybkie
Krzysiekregresja logistycznaTSp-stwo1 / 1?dowolne?
https://github.com/adtech-labs/bayes_logistic/tree/masterregresja logistycznaTSp-stwo1 / 1?dowolneTAKhttps://www.youtube.com/watch?v=W2ILJQu5L1Q
if w = 0 and converiance matrix was diagonal with identical values, then the problem would reduce to L2 regularized logistic regression.

diagonal Hessian - useful for large problems

+ możemy policzyć p-value i stwierdzić czy waga istotnie różni się od 0

Krzysiek:

  • potencjalnie probelym numeryczne
  • nie wiemy jak szybko się uczy
  • update per pojedyncze x, żeby mieć update batchowy to trzeba coś doimplementować
  • wyraz wolny musi podać użytkownik!

nie wiem z czego wynika konkretny update!! mu i sigma (sigma)

https://www.cse.wustl.edu/~garnett/cse515t/fall_2024/files/lecture_notes/9.pdf ładnie opisane skąd i jak Laplace approximation w logistic regression

Sherman-Morisson to nie jest przybliżenie, jest to dokładny wzór. Ale uwaga: nie jest znane numeryczna stabilność tego algorytmu (tak mówi wikipedia, i w dodatku wskazuje, że anegdotyczne dowód jest taki, że to może być niestabilne).