WendyShang

@mistralai

Pinned Repositories

a3c_continuous
A continuous action space version of A3C LSTM in pytorch plus A3G design
Language:Python0 2 00
crVAE
[WACV2018] Channel-Recurrent Autoencoding for Image Modeling
Language:Lua5 3 01
curl
CURL: Contrastive Unsupervised Representation Learning for Sample-Efficient Reinforcement Learning
Language:Python0 1 00
dqn_zoo
DQN Zoo is a collection of reference implementations of reinforcement learning agents developed at DeepMind based on the Deep Q-Network (DQN) agent.
Language:Python5 2 00
eccv16_attr2img
Torch implementing of attribute2image project
Language:Lua0 2 00
ecml19_sa3c
[ECML2019] Stochastic Actor Critic Methods
Language:Python3 1 01
ELF
An End-To-End, Lightweight and Flexible Platform for Game Research
Language:C++0 2 00
flare
Reinforcement Learning with Latent Flow
Language:Python43 3 16
gym-minigrid
Minimalistic gridworld environment for OpenAI Gym
Language:Python0 2 00
wacv19_acVAE
[WACV2019] Attentive Attribute-Conditioned Channel-Recurrent Autoencoding
Language:Lua2 3 00

WendyShang's Repositories

WendyShang/flare
Reinforcement Learning with Latent Flow
Language:Python43 3 16
WendyShang/crVAE
[WACV2018] Channel-Recurrent Autoencoding for Image Modeling
Language:Lua5 3 01
WendyShang/dqn_zoo
DQN Zoo is a collection of reference implementations of reinforcement learning agents developed at DeepMind based on the Deep Q-Network (DQN) agent.
Language:Python5 2 00
WendyShang/ecml19_sa3c
[ECML2019] Stochastic Actor Critic Methods
Language:Python3 1 01
WendyShang/wacv19_acVAE
[WACV2019] Attentive Attribute-Conditioned Channel-Recurrent Autoencoding
Language:Lua2 3 00
WendyShang/a3c_continuous
A continuous action space version of A3C LSTM in pytorch plus A3G design
Language:Python0 2 00
WendyShang/curl
CURL: Contrastive Unsupervised Representation Learning for Sample-Efficient Reinforcement Learning
Language:Python0 1 00
WendyShang/eccv16_attr2img
Torch implementing of attribute2image project
Language:Lua0 2 00
WendyShang/ELF
An End-To-End, Lightweight and Flexible Platform for Game Research
Language:C++0 2 00
WendyShang/gym-minigrid
Minimalistic gridworld environment for OpenAI Gym
Language:Python0 2 00
WendyShang/maxtext
A simple, performant and scalable Jax LLM!
Language:Python0 0
WendyShang/miniF2F-1
Formal to Formal Mathematics Benchmark
Language:Objective-C++1 0
WendyShang/mistral_humaneval_script
a simple script to evaluate mistral API human eval models
Language:Python1 0
WendyShang/Neural-Photo-Editor
A simple interface for editing natural photos with generative neural networks.
Language:Python2 0
WendyShang/pyclient_cppbatcher
This is a simple, minimal example of requesting from python client and process request in batch on cpp side.
1 0
WendyShang/rad
RAD: Reinforcement Learning with Augmented Data
Language:Jupyter Notebook1 0
WendyShang/ray_on_slurm
1 0
WendyShang/reinforcement-learning
Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.
Language:Jupyter Notebook2 0
WendyShang/video_stat_dyna
3 0

WendyShang

Pinned Repositories

a3c_continuous

crVAE

curl

dqn_zoo

eccv16_attr2img

ecml19_sa3c

ELF

flare

gym-minigrid

wacv19_acVAE

WendyShang's Repositories

WendyShang/flare

WendyShang/crVAE

WendyShang/dqn_zoo

WendyShang/ecml19_sa3c

WendyShang/wacv19_acVAE

WendyShang/a3c_continuous

WendyShang/curl

WendyShang/eccv16_attr2img

WendyShang/ELF

WendyShang/gym-minigrid

WendyShang/maxtext

WendyShang/miniF2F-1

WendyShang/mistral_humaneval_script

WendyShang/Neural-Photo-Editor

WendyShang/pyclient_cppbatcher

WendyShang/rad

WendyShang/ray_on_slurm

WendyShang/reinforcement-learning

WendyShang/video_stat_dyna