https://arxiv.org/pdf/1905.06874.pdf
Modyfikacja architektury zaproponowanej w Wide & Deep Learning for Recommender Systems. Dołożony został transformer (tylko enkoder). Wyjście z transformera jest konkatenowane z pozostałymi cechami. Po konkatenacji są jeszcze 3 warstwy Dense, co różni ten model od Autoint, w którym jest na końcu jedna warstwa Dense.