minqi

Lucida LabsOxford, UK

Pinned Repositories

dcd
Implementations of robust Dual Curriculum Design (DCD) algorithms for unsupervised environment design.
Language:Python126 6 925
level-replay
This code implements Prioritized Level Replay, a method for sampling training levels for reinforcement learning agents that exploits the fact that not all levels are equally useful for agents to learn from during training.
Language:Python84 9 316
minihack
MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research
Language:Python484 13 4059
minimax
Efficient baselines for autocurricula in JAX.
Language:Python174 6 514
alphazero
Generic implementation of AlphaZero
Language:Python7 3 00
hnatt
Train and visualize Hierarchical Attention Networks
Language:Python203 11 835
learning-to-communicate-pytorch
Learning to Communicate with Deep Multi-Agent Reinforcement Learning in PyTorch
Language:Python345 16 179
procgen
Procgen Benchmark: Procedurally Generated Game-Like Gym Environments
Language:C++1 3 03
PyMDP
Markov decision processes in Python
Language:Python5 2 03
wordcraft
An environment for benchmarking commonsense agents
Language:Python28 3 07

minqi's Repositories

minqi/learning-to-communicate-pytorch
Learning to Communicate with Deep Multi-Agent Reinforcement Learning in PyTorch
Language:Python345 16 179
minqi/hnatt
Train and visualize Hierarchical Attention Networks
Language:Python203 11 835
minqi/wordcraft
An environment for benchmarking commonsense agents
Language:Python28 3 07
minqi/alphazero
Generic implementation of AlphaZero
Language:Python7 3 00
minqi/PyMDP
Markov decision processes in Python
Language:Python5 2 03
minqi/procgen
Procgen Benchmark: Procedurally Generated Game-Like Gym Environments
Language:C++1 3 03
minqi/auto-drac
Automatic Data-Regularized Actor-Critic (Auto-DrAC)
Language:Python0 2 00
minqi/awesome-open-ended
1 0
minqi/babyai
BabyAI platform. A testbed for training agents to understand and execute language commands.
Language:Python2 0
minqi/baselines
OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
Language:Python2 01
minqi/basicnn
Common neural networks in numpy
Language:Python2 0
minqi/carracingf1
3 0
minqi/cma_mae
A python implementation of Covariance Matrix Adaptation MAP-Annealing
Language:Python1 0
minqi/EGG
EGG: Emergence of lanGuage in Games
Language:Jupyter Notebook3 0
minqi/facenet
Face recognition using Tensorflow
Language:Python2 0
minqi/gym-minigrid
Minimalistic gridworld package for OpenAI Gym
Language:Python3 0
minqi/minimax-updates
Efficient baselines for autocurricula in JAX.
Language:Python
minqi/minqi.github.io
Language:JavaScript2 0
minqi/papers
2 0
minqi/pytorch-a2c-ppo-acktr-gail
PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) and Generative Adversarial Imitation Learning (GAIL).
Language:Python3 0
minqi/random-network-distillation
Code for the paper "Exploration by Random Network Distillation"
Language:Python2 0
minqi/scikit-learn
scikit-learn: machine learning in Python
Language:Python1 0
minqi/scipy
SciPy library main repository
Language:Python1 0
minqi/seq2seq
Example attention-seq2seq implementations.
Language:Python3 0
minqi/tfjs
A WebGL accelerated JavaScript library for training and deploying ML models.
Language:TypeScript1 0
minqi/tfjs-converter
Convert TensorFlow SavedModel and Keras models to TensorFlow.js
Language:JavaScript2 0
minqi/ued
Open-Ended Autocurricula
Language:Python3 0
minqi/v139
Proceedings of ICML 2021
Language:TeX2 0
minqi/vae
VAE implementations
Language:Python4 0
minqi/vqvae
A pytorch implementation of the vector quantized variational autoencoder (https://arxiv.org/abs/1711.00937)
Language:Jupyter Notebook1 0