https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8937515
Może reinforcement learning?
Główny cel publikacji to zaproponowanie rozwiązania, które rozwiązuje problem cold-start startującej kampanii - jak szybko i optymalnie zebrać dane do uczenia modelu na nowej kampanii? Poruszany problem może być tożsamy z Rozszerzanie zbioru danych.
W publikacji rozpatrują system typu Stream-based Active learning. Żeby to zrobić trzeba nie tylko decydować którą instancję danych potrzebujemy do treningu, ale musimy znać też landscape żeby wyznaczyć taką cenę, która wygra, dzięki czemu faktycznie zbierzemy tą instancję do treningu.
Jak decydować, że dany bid request wart jest kupienia? Opis przeniesiony do ^61b756.
Zakładają tutaj, że nie znają ceny, która wygrała (na pow. WP mamy łatwiej - znamy wygrywającą cenę) - wykorzystują product limit estimation do estymacji landscape przy ocenzurowanych danych.
Używają również Bayesian online learning probit regression do online-learningu.
Zakładają, że prawdopodobieństwo wygrania zależy tylko od ceny, którą zabidujemy; nie zależy od bid requestu.
Mając landscape, używają go do Unbiased bidding.