Quartz 4

Home

❯

sources

❯

papers

❯

Neural Thompson Sampling

Neural Thompson Sampling

Sep 23, 20251 min read

https://arxiv.org/pdf/2010.00827

Wielowarstwowa feed-forward sieć, tylko z relu. Wyjściem jest rozkład normalny, czyli daje ranking, ale nie predykcję CTRa (czyli słabo się nadaje do CTR, CVR prediction problem)

(publikacja nie przeczytana do końca)


Graph View

Backlinks

  • Contextual Multi-arm Bandit Problem

Created with Quartz v4.4.1 © 2025

  • GitHub
  • Discord Community