Autorzy rysują sieci przyczynowe dla real-time-biddingu, co jest bardzo ciekawe. Autorzy zakładają isolation assumption, co wiele im ułatwia.
Isolation assumption
Zakładamy, że zmienne egzogeniczne pochodzą z nieznanego, ale ustalonego łącznego rozkładu prawdopodobieństwa. Założenie to oznacza, że efekty przyczynowe nie przepływają z aukcji do aukcji; czyli, inaczej mówiąc, nasze modele nie wpływają na zachowanie użytkownika w innych aukcjach, podobnie jak nie wpływają na to czy klienci (sklepy) od nas odejdą czy nie.
^dd4f80 Markov factorization
Insight: Multi-arm Bandit a Reinforcement learning
Analiza kontrfaktyczna
W standardowych systemach ML (np. klasyfikacja obrazków), aby odpowiedzieć na pytanie “jak zachowałby się nowy model M* na danych, na których do tej pory działał model M” możemy zrobić “replaying”, czyli nowy model M* odpytać na danych, które mamy. W RTB nie możemy tak zrobić, ponieważ to jak dobrze zadziałałby M* zależy od czynników (innych bidderów), które nie obserwujemy.
Opisują Importance sampling z punktu widzenia analizy kontrfaktycznej. To znaczy opisują w jaki sposób wykorzystać Importance sampling do policzenia kontrfaktycznej wartości oczekiwanej jakiejś zmiennej (np. do policzenia liczby klików ze strony gdybyśmy użyli innego modelu M*). Z tym, że autorzy analizują to w kontekście reklam w wyszukiwarce (search advertising) i nie rozważają za bardzo aukcji. Tzn. u nas, wykorzystanie tego wymagałoby dobrego zamodelowania landscapu.
Autorzy pokazują też w jaki sposób wykorzystać analizę kontrfaktyczną do estymacji jak zmienią się przychody po zmianie floorów.
Uwaga: autorzy analizują aukcje second price. Przejście na first price może zmienić strukturę sieci przyczynowej, ale nie powinno wpłynąć na ogólne zastosowanie metod, które tam podają.
Uwaga 2: autorzy poruszają również temat paradoksu Simpsona.