“Dobrze znanym” rezultatem z teorii aproksymacji stochastycznej (stochastic approximation theory) są takie warunki na zbieżność: oraz

str. 33 książki, równanie 2.7

Źródło: Reinforcement Learning An introduction