Problem poruszany w publikacji: CTR, CVR prediction problem.
Jako metryki oceniającej model używają Normalized Binary Cross-Entropy. Używają Transformacja cech drzewami pod model liniowy jako ekstraktora cech - Normalized Binary Cross-Entropy polepszone dzięki temu o 3,5%! Na taki ekstraktor cech binarnych nakładają model liniowy - używają Bayesian online learning probit regression (oparte na Web-scale bayesian click-through rate prediction for sponsored search advertising in Microsoft’s Bing search engine).
Używają Feature importance do ścięcia liczby cech i optymalizacji wydajności.
Używają też Negative down-sampling do poprawy działania modelu - wyniki takiego modelu muszą re-kalibrować (Kalibracja modeli)