Modele liniowe
propozycja planu
Co chcemy zrobić?
::: block Chcemy zrobić alternatywę dla obecnych bandytów w HIGu, tak aby:
- rozwiązanie było łatwo przenaszalne w inne miejsca w WPM / holdingu
- uczyło się online (jak bandyci)
- samplowało (jak bandyci)
- można było wykorzystać więcej cech niż w bandytach
Po pierwsze: dane
::: block
Wymaganie: dane muszą spływać online (circa)
Ścieżka #1
Najwygodniej, aby FS podawał nam dane tak jak obecnie są przygotowywane do trenowania naszych modeli, ale online w paczkach / streamignowo.
Ścieżka #2
Mechanizm z ćmy:
- dodanie cechy to modyfikacja schemy w bazie
- ale rabialne szybko
Po drugie: model
::: block
Dostępne opcje:
- LinUCB (lub LinThompsonSampling) per kampania - aktualnie w ĆMIE
- wada: dostajemy ranking, a nie prawdopodobieństwo
- OBLR = online bayesian logistic regression (by Krzyś P) per kampania
- zalety:
- mamy pełną macierz kowariancji
- dostajemy prawdopodobieństwo (rozkład)
- wady:
- jeden model prawdopodobnie będzie lepszy niż model per kampania
- potencjalne problemy wydajnościowe w przypadku dużej liczby cech (display: ponad 50k cech)
- zalety:
- OBPR = online bayesian probit regression (aka “bayesian”) jako jeden model
- zalety:
- szybkie nawet dla dużej liczby cech (ale rzadkich)
- dostajemy prawdopodobieństwo (rozkład)
- działa już od dawna na produkcji w ROAS CTR
- wady:
- cechy binarne, wymagana dyskretyzacja
- zalety:
Plan działania
::: block Zaczynamy od mailingu CPC.
- FS - wypracowanie koncepcji datasetów online
- Implementacja trenowania OBLR i OBPR w rozwiązaniu z ĆMY
- Implementacja inferencji w pytorch OBLR i OBPR w rozwiązanu z ĆMY
- Implementacja douczania na najnowszych danych w rozwiązaniu z ĆMY