Quartz 4

Home

❯

ML

❯

RL

❯

Monte Carlo Exploring Starts (ES)

Monte Carlo Exploring Starts (ES)

Sep 23, 20251 min read

Algorytm typu Monte Carlo Methods (RL)

Zasada działania: przy każdym epizodzie robimy exploring starts. Po każdym epizodzie aktualizujemy funkcję q i od razu politykę. To zbiega (chociaż nie jest formalnie udowodnione).

Źródło: Reinforcement Learning An introduction


Graph View

Backlinks

  • Epsilon-soft
  • Monte Carlo Methods (RL)

Created with Quartz v4.4.1 © 2025

  • GitHub
  • Discord Community