Modeling Delayed Feedback in Display Advertising

http://www0.cs.ucl.ac.uk/staff/w.zhang/rtb-papers/delayed-feedback.pdf

Postawiony problem: mamy model uczony na 3 tygodniach danych, przeuczany codziennie (ponieważ codziennie dochodzą nowe kampanie), atrybucja jest 30 dniowa. W jaki sposób uwzględnić fakt, że jeśli nie zarejestrowaliśmy do tej pory konwersji do klika, to faktycznie konwersji może nie być, ale może też ona nadejść dopiero w przyszłości?

Problem to Jak uczyć model gdy powoli spływają odpowiedzi.

Oznaczenie zmiennych losowych: $Y \in {0, 1}$ - czy była konwersja w naszym oknie czasowym (czyli to co mamy w danych) $C \in {0, 1}$ - czy ostatecznie była konwersja (zmienna ukryta) $D$ - opóźnienie między klikiem a konwersją (jeśli $C = 1$ ) $E$ - czas, który minął od klika do teraz (chwili trenowania/pobierania danych)

$X$ - cechy opisujące bid request

Obserwacje

(1) $Y = 0 ⟺ C = 0 \lor E < D$

(2) $P [C, D ∣ X, E] = P [C, D ∣ X]$ , czyli to czy ostatecznie była konwersja i w jakim opóźnieniu od klika jest niezależne od czasu w którym obserwujemy klika (niezależne od $E$ ).

Model

Modelujemy:

$P [C = 1∣ X = x]$ jako regresja logistyczna (ale oczywiście może to być też sieć neuronowa)
$P [D = d ∣ X = x, C = 1]$ gdzie zakładamy, że rozkład jest eksponencjalny i regresja liniowa (lub siec neurnowa) przewiduje parametr tego rozkładu.

Mając dwa powyższe można analitycznie wyznaczyć $P [Y = 1, D = d ∣ X = x, E = e]$ oraz $P [Y = 0∣ X = x, E = e]$ , czyli p-stwa naszych obserwacji. Więc trzeba uczyć sieć na $Y$ , potem wyciąganć część estymującą $C$ i tą część używać do predykcji na produkcji.

Quartz 4

Explorer

Modeling Delayed Feedback in Display Advertising

Obserwacje

Model

Graph View

Table of Contents

Backlinks