Handling many conversions per click in modeling delayed feedback

https://www.youtube.com/watch?v=jJB6vV5Wgmk

Rozwiązany problem: Jak uczyć model gdy powoli spływają odpowiedzi

Publikacja jest o tyle różna od Modeling Delayed Feedback in Display Advertising, że tutaj przewidujemy wiele konwersji do jednego klika, a tam było założenie, że mamy tylko jedną konwersję do klika.

Najważniejsze pomysły:

Splitujemy nasz 30-dniowy okres na np. 3 kawałki: $[0; 3)$ dni, $[3, 10)$ dni i $[10; 30)$ dni. Robimy 3 modele - każdy model przewiduje czy konwersja będzie odpowiednio w pierwszym, drugim albo trzecim przedziale. Na produkcji sumujemy odpowiedzi z 3 modeli. Model 1 będzie uczony na nowszych danych, bo ma tylko 3 dni opóźnienia. Wady: na prodzie musimy wołać wszystkie modele
Thermometer encoding - tak jak powyżej dzielimy 30-dniowy okres na 3 kawałki. W przypadku modelu 3 po 30 dniach od aukcji uczymy go przewidywać przedział $[10; 30)$ . Model 2 po 10 dniach od aukcji uczymy tak, że label to “ile było konwersji między 3 a 10 dniem” + predykcja modelu 3. A model 1 po 3 dniach od aukcji uczymy tak, że label to “ile było konwersji między 0 a 3 dniem” + predykcja modelu 2. W ten sposób na produkcji predykujemy tylko z jednego modelu.

Autorzy pokazują że model uczony za pomocą theremometer encoding ma dużo mniejszy bias i lepszy log loss niż model uczony “normalnie”, czyli taki, który uczony jest tylko na klikach, które dojrzały, czyli mają opóźnienie 30 dni.

Quartz 4

Explorer

Handling many conversions per click in modeling delayed feedback

Graph View

Backlinks