2025.05.09 Modele liniowe

propozycja planu

::: block Chcemy zrobić alternatywę dla obecnych bandytów w HIGu, tak aby:

::: block

Wymaganie: dane muszą spływać online (circa)

Najwygodniej, aby FS podawał nam dane tak jak obecnie są przygotowywane do trenowania naszych modeli, ale online w paczkach / streamignowo.

Mechanizm z ćmy:

::: block

Dostępne opcje:

LinUCB (lub LinThompsonSampling) per kampania - aktualnie w ĆMIE
- wada: dostajemy ranking, a nie prawdopodobieństwo
OBLR = online bayesian logistic regression (by Krzyś P) per kampania
- zalety:
  - mamy pełną macierz kowariancji
  - dostajemy prawdopodobieństwo (rozkład)
- wady:
  - jeden model prawdopodobnie będzie lepszy niż model per kampania
  - potencjalne problemy wydajnościowe w przypadku dużej liczby cech (display: ponad 50k cech)
OBPR = online bayesian probit regression (aka “bayesian”) jako jeden model
- zalety:
  - szybkie nawet dla dużej liczby cech (ale rzadkich)
  - dostajemy prawdopodobieństwo (rozkład)
  - działa już od dawna na produkcji w ROAS CTR
- wady:
  - cechy binarne, wymagana dyskretyzacja

::: block Zaczynamy od mailingu CPC.