https://arxiv.org/pdf/2505.19755
Mają generalnie jedną architekturę (jeden model) i odpytują go na raz wszystkimi dostępnymi kampaniami. Kampanie te podają jako sekwencję (jak do modelu językowego). W sieci która przetwarza te sekwencję (RecFormer) mają jakiś mechanizm, który robi klasteryzację? co powoduje, że jest mniej obliczeń niż gdyby robić zapytanie do modelu per każda kampania osobno.
Uczą model też w sposób ciekawy, bo dla reklam które faktycznie sie wyświetliły to podają faktyczną informację czy był klik czy nie, ale oprócz tego do modelu podczas treningu podają informację o reklamach które się nie wyświetliły i jako output podają informację o tym czy user miał z tą reklamą interakcję wcześniej (w innym kontekście, czasie).