https://research.facebook.com/file/273183074306353/practical-lessons-from-predicting-clicks-on-ads-at-facebook.pdf

Problem poruszany w publikacji: CTR, CVR prediction problem.

Jako metryki oceniającej model używają Normalized Binary Cross-Entropy. Używają Transformacja cech drzewami pod model liniowy jako ekstraktora cech - Normalized Binary Cross-Entropy polepszone dzięki temu o 3,5%! Na taki ekstraktor cech binarnych nakładają model liniowy - używają Bayesian online learning probit regression (oparte na Web-scale bayesian click-through rate prediction for sponsored search advertising in Microsoft’s Bing search engine).

Używają Feature importance do ścięcia liczby cech i optymalizacji wydajności.

Używają też Negative down-sampling do poprawy działania modelu - wyniki takiego modelu muszą re-kalibrować (Kalibracja modeli)

facebook FAIR