Quartz 4

Home

❯

ML

❯

Regret

Regret

Sep 23, 20251 min read

Metryka używana w Contextual Multi-arm Bandit Problem, jest to różnica w nagrodzie między najlepszą możliwą akcją a akcją faktycznie wykonaną.

Źródło: A Practical Method for Solving Contextual Bandit Problems Using Decision Trees


Graph View

Backlinks

  • Cumulative regret
  • A Contextual-Bandit Approach to Personalized News Article Recommendation
  • Contextual Bandits with Linear Payoff Functions

Created with Quartz v4.4.1 © 2025

  • GitHub
  • Discord Community