http://proceedings.mlr.press/v28/agrawal13.pdf
Głównym osiągnięciem publikacji jest oszacowanie upper bound na regret algorytmu Linear Thompson sampling, Contextual Bandits, rozwiązującego problem Contextual Multi-arm Bandit Problem.
http://proceedings.mlr.press/v28/agrawal13.pdf
Głównym osiągnięciem publikacji jest oszacowanie upper bound na regret algorytmu Linear Thompson sampling, Contextual Bandits, rozwiązującego problem Contextual Multi-arm Bandit Problem.