https://arxiv.org/pdf/2208.01951.pdf

Praca porusza problem Wyznaczanie rozkładu przychodu biddera i Rozszerzanie zbioru danych. Konkretnie, problem polega na tym, że różne SSP przychodzą i odchodzą, niektóre z nich mogą być niezbyt dobrze wysamplowane.

Core pomysłu polega na użyciu Monte Carlo Dropout do otrzymania rozkładu na odpowiedź. Robią eksplorację nie na wszystkich cechach, tylko na tych związanych z SSP (z wydawcą), dlatego wszystkie pozostałe cechy fixują jakimiś stałymi wartościami i odpytują model, dostając rozkład odpowiedzi dla konkretnych SSP. Jeśli rozkład ma dużą niepewność, zwiększają cenę bidu. W dodatku mają zapięty Feedback controller po to, żeby nie stracić za dużo samplując.