HumanCompatibleAI/interpreting-rewards

Experiments in applying interpretability techniques to learned reward functions.

Jupyter Notebook

Readme
0Issues
9Stargazers
5Watchers

No issues in this repository yet.

Topics

deep-reinforcement-learning interpretability reward-learning

Contact site admin: Geeks.