Modele liniowe

propozycja planu

Co chcemy zrobić?

::: block Chcemy zrobić alternatywę dla obecnych bandytów w HIGu, tak aby:

  1. rozwiązanie było łatwo przenaszalne w inne miejsca w WPM / holdingu
  2. uczyło się online (jak bandyci)
  3. samplowało (jak bandyci)
  4. można było wykorzystać więcej cech niż w bandytach

Po pierwsze: dane

::: block

Wymaganie: dane muszą spływać online (circa)

Ścieżka #1

Najwygodniej, aby FS podawał nam dane tak jak obecnie są przygotowywane do trenowania naszych modeli, ale online w paczkach / streamignowo.

Ścieżka #2

Mechanizm z ćmy:

  1. dodanie cechy to modyfikacja schemy w bazie
  2. ale rabialne szybko

Po drugie: model

::: block

Dostępne opcje:

  1. LinUCB (lub LinThompsonSampling) per kampania - aktualnie w ĆMIE
    • wada: dostajemy ranking, a nie prawdopodobieństwo
  2. OBLR = online bayesian logistic regression (by Krzyś P) per kampania
    • zalety:
      • mamy pełną macierz kowariancji
      • dostajemy prawdopodobieństwo (rozkład)
    • wady:
      • jeden model prawdopodobnie będzie lepszy niż model per kampania
      • potencjalne problemy wydajnościowe w przypadku dużej liczby cech (display: ponad 50k cech)
  3. OBPR = online bayesian probit regression (aka “bayesian”) jako jeden model
    • zalety:
      • szybkie nawet dla dużej liczby cech (ale rzadkich)
      • dostajemy prawdopodobieństwo (rozkład)
      • działa już od dawna na produkcji w ROAS CTR
    • wady:
      • cechy binarne, wymagana dyskretyzacja

Plan działania

::: block Zaczynamy od mailingu CPC.

  1. FS - wypracowanie koncepcji datasetów online
  2. Implementacja trenowania OBLR i OBPR w rozwiązaniu z ĆMY
  3. Implementacja inferencji w pytorch OBLR i OBPR w rozwiązanu z ĆMY
  4. Implementacja douczania na najnowszych danych w rozwiązaniu z ĆMY