https://arxiv.org/pdf/2101.02284 https://www.youtube.com/watch?v=jJB6vV5Wgmk
Publikacja jest o tyle różna od Modeling Delayed Feedback in Display Advertising, że tutaj przewidujemy wiele konwersji do jednego klika, a tam było założenie, że mamy tylko jedną konwersję do klika.
Najważniejsze pomysły:
- Splitujemy nasz 30-dniowy okres na np. 3 kawałki: dni, dni i dni. Robimy 3 modele - każdy model przewiduje czy konwersja będzie odpowiednio w pierwszym, drugim albo trzecim przedziale. Na produkcji sumujemy odpowiedzi z 3 modeli. Model 1 będzie uczony na nowszych danych, bo ma tylko 3 dni opóźnienia. Wady: na prodzie musimy wołać wszystkie modele
- Thermometer encoding - tak jak powyżej dzielimy 30-dniowy okres na 3 kawałki. W przypadku modelu 3 po 30 dniach od aukcji uczymy go przewidywać przedział . Model 2 po 10 dniach od aukcji uczymy tak, że label to “ile było konwersji między 3 a 10 dniem” + predykcja modelu 3. A model 1 po 3 dniach od aukcji uczymy tak, że label to “ile było konwersji między 0 a 3 dniem” + predykcja modelu 2. W ten sposób na produkcji predykujemy tylko z jednego modelu.
Autorzy pokazują że model uczony za pomocą theremometer encoding ma dużo mniejszy bias i lepszy log loss niż model uczony “normalnie”, czyli taki, który uczony jest tylko na klikach, które dojrzały, czyli mają opóźnienie 30 dni.