Rozwój modeli
Propozycje na roadmapę H1 2023
Mini agenda
- Modelowanie zachowania użytkownika
- Bayesowskie podejście w retargetingu
- Kalibracja per grupa
Modelowanie zachowania użytkownika
::: block
Problem
W jaki sposób lepiej wychwycić wzór zachowania użytkowników?
Jaki KPI adresujemy?
GMV - spodziewamy się, że wzór zachowania użytkownika pozwoli na ich lepszą separację, czyli akuratniejsze przewidywanie CVR, czyli lepszą wycenę
note: Mając wzory zachowań, tzn. jeśli ktoś 4 razy oglądał buty to jest większa szansa na kupno niż jak oglądał jeden raz.
Propozycja rozwiązania
Model sekwencyjny!
Typy zachowań użytkowników trudno jest ręcznie “ocechowywać”, więc chcemy zbudować model, którego karmimy sekwencją akcji użytkownika i który w jakiś sposób embedduje sekwencję zdarzeń (wzór zachowania).
Rozkład jazdy
::: block
- Model behawioralny wbudowany w główny model: przeuczyć BST z datasetem sekwencyjnym, który mamy już wygenerowany; porównać z takim samym modelem bez cechy sekwencyjnej
- Wydzielony model behawioralny (LSTM lub Transformer); zalety:
- może być trenowany na wszystkich eventach, nie tylko na naszych sesjach,
- trenowany self-supervised - przewiduje następny event lub odpowiada na pytania dotyczące kilku następnych eventów,
- zacznijmy od sekwencji per sklep, później mogą to być wszystkie sklepy.
- time-from-last-event:
- FS: Przygotować osobny dataset pod model behawioralny
- FS: Niezależnie od datasetu wyżej dataset pod CVR też będzie musiał mieć sekwencję podczas uczenia!
- FS: Wymaga przeliczenia wektora behawioralnego online, ale tylko po każdym evencie użytkownika
- time-to-latest-event:
- FS: wymaga innego liczenia czasu
- time-to-current-bid-request:
- FS: wymaga częstszego przeliczania wektora behawioralnego online - ale można skwantyzować czas: 1 min, 2, 4, 8, 16 min, …
- Problematyczny proces uczenia BNN - musimy symulować czas pomiędzy eventem a bid requestem
Zależności
Feature Store
Bayesowskie podejście w retargetingu
::: block
Problem
Powoli dostosowujemy się do zmian na rynku:
- nowe powierzchnie,
- nowe formaty reklamowe,
- nowe kampanie.
Obecne podejście wymaga retreningu modelu lub zaprojektowania odpowiedniej cechy.
Jaki KPI adresujemy?
GMV - im szybciej będziemy nadążać za zmianami tym nasze wyceny będą bardziej akuratne, a im bardziej akuratne tym lepsze GMV.
note: ostatni przykład: slot 006
Propozycja rozwiązania
<live>
Propozycja rozwiązania
::: block Co z tego mamy?
- rozkłady wag zmieniają się w czasie, więc dostosowujemy się online bez retrenowania modelu
- odpowiedź modelu losujemy z rozkładu, więc samplujemy dane
- bonus: mając rozkład na odpowiedź z modelu możemy w razie potrzeby podbijać cenę dla tych danych, które mają dużą niepewność, zbierając w ten sposób wartościowe dla nas dane do uczenia
Rozkład jazdy
::: block
- Dodanie warstwy binarnej do aktualnego modelu i zobaczenie jego wpływu na wyniki i czas odpowiedzi.
- Zmiana sposobu trenowania modelu tak, że ostatnia warstwa będzie warstwą dającą rozkład na CTR.
- Zaprojektowanie systemu aktualizującego online wagi ostatniej warstwy sieci.
Zależności
brak
Kalibracja per grupa
::: block
Problem
Brak kalibracji per grupa.
Jaki KPI adresujemy?
GMV - jeśli niedoszacowujemy, to zwiększając wyceny możemy zacząć wygrywać aukcje, zwiększając udział w GMV; jeśli przeszacowujemy, to zmniejszając wyceny chronimy marżę (możemy tez wtedy dodatkowe środki przekierować na zdobywanie danych tam gdzie ich potrzebujemy)
Propozycja rozwiązania
Paper: On the Factory Floor ML Engineering for Industrial-Scale Ads Recommendation Models
Zależności
brak
- cechy, cechy, cechy
2023.01.25 Roadmapa WP - Behavioural NN.excalidraw
⚠ Switch to EXCALIDRAW VIEW in the MORE OPTIONS menu of this document. ⚠
Text Elements
Link to original