Sposób wprowadzenia eksploracji do metody Monte Carlo Methods (RL). Polega na tym, że każdy epizod zaczynamy w innym stanie. Źródło: Reinforcement Learning An introduction