jannerm

UC Berkeley

Pinned Repositories

homework_fall2020
Assignments for Berkeley CS 285: Deep Reinforcement Learning (Fall 2020)
Language:Jupyter Notebook251 9 6246
ddpo
Code for the paper "Training Diffusion Models with Reinforcement Learning"
Language:Python426 6 1128
diffuser
Code for the paper "Planning with Diffusion for Flexible Behavior Synthesis"
Language:Python1k 12 64167
face-intrinsics
Language:MATLAB12 2 12
gamma-models
Code for the paper "Gamma-Models: Generative Temporal Difference Learning for Infinite-Horizon Prediction"
Language:Python44 8 28
intrinsics-network
Code for the paper "Self-Supervised Intrinsic Image Decomposition"
Language:Lua144 9 1427
mbpo
Code for the paper "When to Trust Your Model: Model-Based Policy Optimization"
Language:Python487 9 2384
o2p2
Language:Python25 3 25
spatial-reasoning
Code for the paper "Representation Learning for Grounded Spatial Reasoning"
Language:Python52 3 014
trajectory-transformer
Code for the paper "Offline Reinforcement Learning as One Big Sequence Modeling Problem"
Language:Python483 6 2065

jannerm's Repositories

jannerm/diffuser
Code for the paper "Planning with Diffusion for Flexible Behavior Synthesis"
Language:Python1k 12 64167
jannerm/mbpo
Code for the paper "When to Trust Your Model: Model-Based Policy Optimization"
Language:Python487 9 2384
jannerm/trajectory-transformer
Code for the paper "Offline Reinforcement Learning as One Big Sequence Modeling Problem"
Language:Python483 6 2065
jannerm/ddpo
Code for the paper "Training Diffusion Models with Reinforcement Learning"
Language:Python426 6 1128
jannerm/intrinsics-network
Code for the paper "Self-Supervised Intrinsic Image Decomposition"
Language:Lua144 9 1427
jannerm/spatial-reasoning
Code for the paper "Representation Learning for Grounded Spatial Reasoning"
Language:Python52 3 014
jannerm/gamma-models
Code for the paper "Gamma-Models: Generative Temporal Difference Learning for Infinite-Horizon Prediction"
Language:Python44 8 28
jannerm/o2p2
Language:Python25 3 25
jannerm/face-intrinsics
Language:MATLAB12 2 12
jannerm/torch-colormap
MATLAB-style colormaps for Torch
Language:Lua5 1 00
jannerm/bullet-manipulation
Robotic manipulation in PyBullet
Language:Python3 19 03
jannerm/slice-sampling
Language:Python3 2 0
jannerm/d4rl
A benchmark for offline reinforcement learning.
Language:Python2 1 03
jannerm/bairblog.github.io
Language:JavaScript1 0
jannerm/bullet3
Bullet Physics SDK: real-time collision detection and multi-physics simulation for VR, games, visual effects, robotics, machine learning etc.
Language:C++1 0
jannerm/diffusers
🤗 Diffusers: State-of-the-art diffusion models for image and audio generation in PyTorch
Language:Python0 0
jannerm/doodad
Language:Python1 01
jannerm/gamma-blog
Language:HTML2 0
jannerm/Gumbel_Softmax_VAE
PyTorch implementation of a Variational Autoencoder with Gumbel-Softmax Distribution
Language:Python1 0
jannerm/gym_minigrid
Language:Python2 0
jannerm/mbpo-www
Language:HTML2 0
jannerm/mujoco-py
MuJoCo is a physics engine for detailed, efficient rigid body simulations with contacts. mujoco-py allows using MuJoCo from Python 3.
Language:Python1 01
jannerm/ray
Ray is a unified framework for scaling AI and Python applications. Ray consists of a core distributed runtime and a toolkit of libraries (Ray AIR) for accelerating ML workloads.
Language:Python0 0
jannerm/rlkit
Collection of reinforcement learning algorithms
Language:Python1 0
jannerm/SimpleSAC
A simple and easy to use implementation of the soft actor-critic algorithm.
Language:Python1 0
jannerm/viskit
rllab's viskit with some added features
Language:Python1 0

jannerm

Pinned Repositories

homework_fall2020

ddpo

diffuser

face-intrinsics

gamma-models

intrinsics-network

mbpo

o2p2

spatial-reasoning

trajectory-transformer

jannerm's Repositories

jannerm/diffuser

jannerm/mbpo

jannerm/trajectory-transformer

jannerm/ddpo

jannerm/intrinsics-network

jannerm/spatial-reasoning

jannerm/gamma-models

jannerm/o2p2

jannerm/face-intrinsics

jannerm/torch-colormap

jannerm/bullet-manipulation

jannerm/slice-sampling

jannerm/d4rl

jannerm/bairblog.github.io

jannerm/bullet3

jannerm/diffusers

jannerm/doodad

jannerm/gamma-blog

jannerm/Gumbel_Softmax_VAE

jannerm/gym_minigrid

jannerm/mbpo-www

jannerm/mujoco-py

jannerm/ray

jannerm/rlkit

jannerm/SimpleSAC

jannerm/viskit