http://www2007.cpsc.ucalgary.ca/papers/paper784.pdf
Problem poruszany w pracy to CTR, CVR prediction problem. Z tym, że problem nie jest typowym biddowaniem, ale bardziej problemem sponsored-search, tzn. tutaj wybieramy reklamę pod słowa klucze, które user wpisał w wyszukiwarkę.
Podkreślają, że dla “znanej” kampanii, która długo trwa możliwe jest empiryczne policzenie jej klikalności (poprzez zliczanie liczby klików i liczby impresji, zakładają że CTR kampanii nie zmienia się w czasie). Ale CTR trzeba wyestymować dla nowych kampanii.
Features, które biorą pod uwagę to głównie analiza tesktu reklamy, truność słów, temat - reklama to nie jest obrazek, tak jak w WP, ale wynik wyszukiwania (tekstowy!).
Jako metryki oceny używają KL-divergence (wydaje mi się, że robią to tak, że biorą “prawdziwy” CTR kampanii - prawdziwy, czyli taki, który estymujemy np. po miesiącu działania, rysują histogram CTR-ów wszystkich kampanii w datasecie; jednocześnie rysują histogram CTRów, które wypredykował model dla tych kampani - no i mierzą KL-divergence między tymi histogramami (rozkładami)).