https://proceedings.mlr.press/v15/chu11a/chu11a.pdf
Osiągnięciem publikacji jest oszacowanie regret dla algorytmu LinUCB, adresującego problem Contextual Multi-arm Bandit Problem.
https://proceedings.mlr.press/v15/chu11a/chu11a.pdf
Osiągnięciem publikacji jest oszacowanie regret dla algorytmu LinUCB, adresującego problem Contextual Multi-arm Bandit Problem.