Warunki na zbieżność RL

“Dobrze znanym” rezultatem z teorii aproksymacji stochastycznej (stochastic approximation theory) są takie warunki na zbieżność: $\sum_{n = 1}^{\infty} α_{n} (a) = \infty$ oraz $\sum_{n = 1}^{\infty} α_{n}^{2} (a) < \infty$

str. 33 książki, równanie 2.7

Źródło: Reinforcement Learning An introduction

Quartz 4

Explorer

Warunki na zbieżność RL

Graph View

Backlinks