lukinoe/RL-Power-Distribution-for-power2heat

PyTorch implementation of a Monte Carlo Policy Gradient approach to learn an optimal policy for a power-to-heat device to distribute excess power in a dynamic environment.

Jupyter NotebookApache-2.0

Watchers

lukinoe