Quartz 4

❯

❯

Bernoulli Bandits Problem

Bernoulli Bandits Problem

Apr 11, 20261 min read

Szczególny przypadek Multi-armed Bandit Problem w którym każdy bandyta zwraca odpowiedź binarną (czyli można w ten sposób modelować CTR, CVR prediction problem).

Thompson Sampling w przypadku Bernoulli Bandits

Bandyta zwraca odpowiedź binarną z Rozkład Bernoulliego z parametrem $θ$ . Jeśli Likelihood jest z Rozkład Bernoulliego to Conjugate Prior dla tego rozkładu jest Rozkład Beta, czyli założymy, że $θ$ pochodzi z rozkładu beta.

Graph View

Backlinks

Rotatory
Feedback Control of Real-Time Display Advertising

Created with Quartz v4.4.1 © 2026

GitHub
Discord Community