Rozbicie modelu na mniejsze kawałki po to, żeby zmniejszyć liczbę kombinacji, które trzeba wyliczyć na produkcji.
Jak je łączyć? Np. tak, że dwa mniejsze modele zwracają embeddingi, które lączymy poprzez dot product. Źródło: On the Factory Floor ML Engineering for Industrial-Scale Ads Recommendation Models.