turing-usp/Aprendizado-por-Reforco

Repositório de Aprendizado por Reforço desenvolvido pelo Turing USP

Jupyter NotebookMIT

Issues

Atualizar os arquivos em markdown para utilisar latex/mathjax
#49 opened 3 years ago by fernandokm
0
Colocar as imagens das fórmulas com fundo branco
#42 opened 4 years ago by nelsonayamashita
0
Explicação On-Policy vs. Off-Policy
#35 opened 4 years ago by nelsonayamashita
0
Q-Learning
#5 opened 4 years ago by Berbardo
0
Double DQN
#9 opened 4 years ago by dueiras
0
Prioritized Experience Replay
#18 opened 4 years ago by fernandokm
0
Padronizar os gráficos
#33 opened 4 years ago by fernandokm
0
README DQN
#24 opened 4 years ago by dueiras
0
Visualização DQN
#25 opened 4 years ago by dueiras
0
Organizar README.md
#1 opened 4 years ago by Berbardo
0
DQN
#13 opened 4 years ago by Berbardo
0
N-Step DQN
#21 opened 4 years ago by Berbardo
0
Monte Carlo
#3 opened 4 years ago by Berbardo
0
Bandits
#7 opened 4 years ago by Berbardo
0
Implementações em ambientes mais difíceis
#20 opened 4 years ago by dueiras
1
Arquivos .py / .ipynb
#19 opened 4 years ago by fernandokm
0
Convenção de nomenclatura no código
#15 opened 4 years ago by fernandokm
6
Expected Sarsa
#8 opened 4 years ago by Berbardo
0
Dyna-Q e Dyna-Q+
#6 opened 4 years ago by Berbardo
0
Sarsa
#4 opened 4 years ago by Berbardo
0
Value Iteration
#2 opened 4 years ago by Berbardo
0