Sformułowanie problemu
Problem optymalizacyjny:
gdzie:
- to oczekiwany przychód z -tego bid-requesta (wartość -tego bid-requesta)
- to cena, którą biddujemy -ty bid-request
Intuicja
Rozważmy pojedynczy bid-request i funkcję prawdopodobieństwa wygrania od ceny, którą zabidujemy:
Wyróżnijmy dwie sytuacje:2024.02.06 Planowanie H1 2024 Drawing 2024-01-31 10.23.37.excalidraw
⚠ Switch to EXCALIDRAW VIEW in the MORE OPTIONS menu of this document. ⚠
Text Elements
Link to original
- sytuacja A - przesunięcie się w lewo po krzywej - duża zmiana powoduja małą zmianę
- sytuacja B - przesunięcie się w prawo po krzywej - mała zmiana powoduje dużą zmianę
Konkrety
Oznaczenia
- wydatki gdybyśmy grali jak dotychczas - przychody gdybyśmy grali jak dotychczas
Marża
Zakładamy, że . W HIG najczęściej . Uwaga:
Analiza zmienności
Zamodelowanie całej funkcji zależności win-ratio od ceny jest trudne, więc możemy uprościć problem i zastanowić się jak zmienią się przychody i wydatki dla konkretnego bid-requestu i konkretnej ceny, którą chcemy zabidować, jeśli zmodyfikujemy bidowaną cenę o .
Jak więc zmieniają się oczekiwane przychody i wydatki gdy zmienimy o ?
Możemy zwięźle napisać
gdzie
Pierwsza nierówność - maksymalizacja wydatków
Chcemy maksymalizować wydatki, więc chcemy:
Druga nierówność - marża
Lemat: Marża będzie zachowana wtedy i tylko wtedy gdy będzie spełniona poniższa nierówność:
Dowód: Po interwencji landscapu, marża powinna być zachowana:
Jeśli w pierwszej i drugiej nierówności wprowadzimy oznaczenia:
to możemy przeformułować nasz problem optymalizacyjny w poniższy sposób:
Uwaga: Jeśli model jest dobrze skalibrowany to dla jak i dla to oszacowanie też powinno być dobrze skalibrowane. Na pewno??
Jak zoptymalizować powyższy problem?
Niech oraz . Chcemy maksymalizować przy założeniu .
Przypadek (1)
Wówczas
Przypadek (2)
wówczas I tu mamy dwa podprzypadki:
- ; w takiej sytuacji zawsze opłaca się grać, bo maleje, a rośnie
Przypadek (3)
wówczas
I tu mamy dwa podprzypadki:
- ; tak nigdy nie chcemy grać, bo pogarsza zarówno pierwszą jak i drugą nierówność
Dzielimy bidowanie na 2 fazy:
- faza 1, wydatkowanie (expending)
- faza 2, oszczędzanie (saving)
Model win-ratio
gdzie to cechy, a są estymowane przez sieć neuronową.