Quartz 4

Home

❯

ML

❯

Bernoulli Bandits Problem

Bernoulli Bandits Problem

Sep 23, 20251 min read

Szczególny przypadek Multi-armed Bandit Problem w którym każdy bandyta zwraca odpowiedź binarną (czyli można w ten sposób modelować CTR, CVR prediction problem).

Thompson Sampling w przypadku Bernoulli Bandits

Bandyta zwraca odpowiedź binarną z Rozkład Bernoulliego z parametrem θ. Jeśli Likelihood function jest z Rozkład Bernoulliego to Conjugate Prior dla tego rozkładu jest Rozkład Beta, czyli założymy, że θ pochodzi z rozkładu beta.


Graph View

Backlinks

  • Rotatory
  • Feedback Control of Real-Time Display Advertising

Created with Quartz v4.4.1 © 2025

  • GitHub
  • Discord Community