pseudo-rnd-thoughts

PhD Student at the University of Southampton exploring Explainable Reinforcement Learning

pseudo-rnd-thoughts's Stars

huggingface/lerobot
🤗 LeRobot: Making AI for Robotics more accessible with end-to-end learning
Language:Python8.2k 84 166840
arcee-ai/mergekit
Tools for merging pretrained large language models.
Language:Python5.1k 54 335474
chrxh/alien
ALIEN is a CUDA-powered artificial life simulation program.
Language:C++5k 57 82159
facebookresearch/sapiens
High-resolution models for human tasks.
Language:Python4.7k 46 173270
danijar/dreamerv3
Mastering Diverse Domains through World Models
Language:Python1.5k 28 144240
younader/Vesuvius-Grandprize-Winner
Language:Python597 12 240
oTree-org/oTree
Python framework for multiplayer decision games, behavioral experiments, and surveys
Language:Python472 36 69200
salesforce/warp-drive
Extremely Fast End-to-End Deep Multi-Agent Reinforcement Learning Framework on a GPU (JMLR 2022)
Language:Python468 15 3678
ndif-team/nnsight
The nnsight package enables interpreting and manipulating the internals of deep learned models.
Language:Jupyter Notebook457 4 9241
nicklashansen/tdmpc2
Code for "TD-MPC2: Scalable, Robust World Models for Continuous Control"
Language:Python428 6 4499
google-deepmind/treescope
An interactive HTML pretty-printer for machine learning research in IPython notebooks.
Language:Python370 8 1619
proroklab/VectorizedMultiAgentSimulator
VMAS is a vectorized differentiable simulator designed for efficient Multi-Agent Reinforcement Learning benchmarking. It is comprised of a vectorized 2D physics engine written in PyTorch and a set of challenging multi-robot scenarios. Additional scenarios can be implemented through a simple and modular interface.
Language:Python365 9 6072
EdanToledo/Stoix
🏛️A research-friendly codebase for fast experimentation of single-agent reinforcement learning in JAX • End-to-End JAX RL
Language:Python262 7 3326
zuoxingdong/mazelab
A customizable framework to create maze and gridworld environments
Language:Python260 9 959
Emerge-Lab/gpudrive
GPU-acceleration of Nocturne via Madrona
Language:Jupyter Notebook246 5 5720
imbue-ai/carbs
Cost aware hyperparameter tuning algorithm
Language:Jupyter Notebook136 9 613
mttga/purejaxql
Simple single-file baselines for Q-Learning in pure-GPU setting
Language:Python132 1 07
epignatelli/navix
Accelerated minigrid environments with JAX
Language:Python127 3 3211
Farama-Foundation/momaland
Benchmarks for Multi-Objective Multi-Agent Decision Making
Language:Python75 5 815
adityab/CrossQ
Official code release for "CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity"
Language:Python63 4 84
k4ntz/OC_Atari
Object Centric Atari games
Language:Python60 8 211
BricksRL/bricksrl
BricksRL: A Platform for Democratizing Robotics and Reinforcement Learning Research and Education with LEGO
Language:Python54 1 02
strakam/generals-bots
Develop your agent for generals.io!
Language:Python38 3 136
nikaashpuri/sarfa-saliency
Language:C++34 4 36
smearle/autoverse
Generative cellular automaton-like learning environments for RL.
Language:Python19 3 00
brownirl/lambda_discrepancy
Mitigating Partial Observability in Sequential Decision Processes via the Lambda Discrepancy
Language:Python17 1 00
dadecampo/aquatic_navigation_envs
Aquatic navigation environments for Gym
Language:ASP.NET16 2 00
adaptive-intelligent-robotics/QDAC
Repository for "Quality-Diversity Actor-Critic: Learning High-Performing and Diverse Behaviors via Value and Successor Features Critics" (ICML 2024).
Language:Python12 3 01
k4ntz/HackAtari
Language:Python12 6 14
smearle/pcgrl-jax
Language:Python9 2 04

pseudo-rnd-thoughts

pseudo-rnd-thoughts's Stars

huggingface/lerobot

arcee-ai/mergekit

chrxh/alien

facebookresearch/sapiens

danijar/dreamerv3

younader/Vesuvius-Grandprize-Winner

oTree-org/oTree

salesforce/warp-drive

ndif-team/nnsight

nicklashansen/tdmpc2

google-deepmind/treescope

proroklab/VectorizedMultiAgentSimulator

EdanToledo/Stoix

zuoxingdong/mazelab

Emerge-Lab/gpudrive

imbue-ai/carbs

mttga/purejaxql

epignatelli/navix

Farama-Foundation/momaland

adityab/CrossQ

k4ntz/OC_Atari

BricksRL/bricksrl

strakam/generals-bots

nikaashpuri/sarfa-saliency

smearle/autoverse

brownirl/lambda_discrepancy

dadecampo/aquatic_navigation_envs

adaptive-intelligent-robotics/QDAC

k4ntz/HackAtari

smearle/pcgrl-jax