Sformułowanie problemu

Problem optymalizacyjny:

gdzie:

  • to oczekiwany przychód z -tego bid-requesta (wartość -tego bid-requesta)
  • to cena, którą biddujemy -ty bid-request

Intuicja

Rozważmy pojedynczy bid-request i funkcję prawdopodobieństwa wygrania od ceny, którą zabidujemy:

2024.02.06 Planowanie H1 2024 Drawing 2024-01-31 10.23.37.excalidraw

⚠ Switch to EXCALIDRAW VIEW in the MORE OPTIONS menu of this document. ⚠

Text Elements

Link to original
Wyróżnijmy dwie sytuacje:

  • sytuacja A - przesunięcie się w lewo po krzywej - duża zmiana powoduja małą zmianę
  • sytuacja B - przesunięcie się w prawo po krzywej - mała zmiana powoduje dużą zmianę

Konkrety

Oznaczenia

- wydatki gdybyśmy grali jak dotychczas - przychody gdybyśmy grali jak dotychczas

Marża

Zakładamy, że . W HIG najczęściej . Uwaga:

Analiza zmienności

Zamodelowanie całej funkcji zależności win-ratio od ceny jest trudne, więc możemy uprościć problem i zastanowić się jak zmienią się przychody i wydatki dla konkretnego bid-requestu i konkretnej ceny, którą chcemy zabidować, jeśli zmodyfikujemy bidowaną cenę o .

Jak więc zmieniają się oczekiwane przychody i wydatki gdy zmienimy o ?

Możemy zwięźle napisać

gdzie

Pierwsza nierówność - maksymalizacja wydatków

Chcemy maksymalizować wydatki, więc chcemy:

Druga nierówność - marża

Lemat: Marża będzie zachowana wtedy i tylko wtedy gdy będzie spełniona poniższa nierówność:

Dowód: Po interwencji landscapu, marża powinna być zachowana:

Jeśli w pierwszej i drugiej nierówności wprowadzimy oznaczenia:

to możemy przeformułować nasz problem optymalizacyjny w poniższy sposób:

Uwaga: Jeśli model jest dobrze skalibrowany to dla jak i dla to oszacowanie też powinno być dobrze skalibrowane. Na pewno??

Jak zoptymalizować powyższy problem?

Niech oraz . Chcemy maksymalizować przy założeniu .

Przypadek (1)

Wówczas

Przypadek (2)

wówczas I tu mamy dwa podprzypadki:

  1. ; w takiej sytuacji zawsze opłaca się grać, bo maleje, a rośnie
Przypadek (3)

wówczas

I tu mamy dwa podprzypadki:

  1. ; tak nigdy nie chcemy grać, bo pogarsza zarówno pierwszą jak i drugą nierówność

Dzielimy bidowanie na 2 fazy:

  • faza 1, wydatkowanie (expending)
  • faza 2, oszczędzanie (saving)

Model win-ratio

gdzie to cechy, a są estymowane przez sieć neuronową.