Uma implementação simples de Q-learning no ambiente "Taxi-v3" do OpenAI Gym.
Primary LanguageJupyter Notebook