Metryka używana w Contextual Multi-arm Bandit Problem, jest to różnica w nagrodzie między najlepszą możliwą akcją a akcją faktycznie wykonaną.
Źródło: A Practical Method for Solving Contextual Bandit Problems Using Decision Trees
Metryka używana w Contextual Multi-arm Bandit Problem, jest to różnica w nagrodzie między najlepszą możliwą akcją a akcją faktycznie wykonaną.
Źródło: A Practical Method for Solving Contextual Bandit Problems Using Decision Trees