Quartz 4

Home

❯

ML

❯

RL

❯

Rollout algorithms

Rollout algorithms

Sep 23, 20251 min read

Jest to rodzina algorytmów z dziedziny Reinforcement Learning, w których bierzemy stan obecny i począwszy od tego stanu symulujemy kolejne akcje i stany za pomocą Trajectory sampling (dokładnie tak jak w metodach Monte Carlo) i estymujemy wartość akcji poprzez uśrednianie otrzymanych wyników.

Przykładowe algorytmy:

  • Monte Carlo Tree Search

Źródło: Reinforcement Learning An introduction


Graph View

Created with Quartz v4.4.1 © 2025

  • GitHub
  • Discord Community