Problem IRL polega na znalezieniu funkcji rewardu w środowisku Reinforcement Learning.
Źródło: Optimal Bidding Strategy without Exploration in Real-time Bidding
Problem IRL polega na znalezieniu funkcji rewardu w środowisku Reinforcement Learning.
Źródło: Optimal Bidding Strategy without Exploration in Real-time Bidding