Szczególny przypadek Multi-armed Bandit Problem w którym każdy bandyta zwraca odpowiedź binarną (czyli można w ten sposób modelować CTR, CVR prediction problem).
Thompson Sampling w przypadku Bernoulli Bandits
Bandyta zwraca odpowiedź binarną z Rozkład Bernoulliego z parametrem . Jeśli Likelihood function jest z Rozkład Bernoulliego to Conjugate Prior dla tego rozkładu jest Rozkład Beta, czyli założymy, że pochodzi z rozkładu beta.