sanjeevanahilan

Pinned Repositories

nanoChatGPT
A crude RLHF layer on top of nanoGPT with Gumbel-Softmax trick
Language:Python28325
avellaneda-stoikov
Avellaneda-Stoikov HFT market making algorithm implementation
Language:Python00
baselines
OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
Language:Python00
maddpg-rllib
MADDPG in Ray/RLlib
Language:Python00
multiagent-particle-envs
Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"
Language:Python00
questdb
An open source time-series database for fast ingest and SQL queries
Language:Java00
restorePhotos
Restoring old and blurry face photos with AI.
Language:TypeScript00
sanic
Async Python 3.7+ web server/framework | Build fast. Run fast.
Language:Python00
spinningup
An educational resource to help anyone learn deep reinforcement learning.
Language:Python00
langchain
🦜🔗 Build context-aware reasoning applications
Language:Python86.4k13.4k

sanjeevanahilan's Repositories

sanjeevanahilan/nanoChatGPT
A crude RLHF layer on top of nanoGPT with Gumbel-Softmax trick
Language:Python28325
sanjeevanahilan/questdb
An open source time-series database for fast ingest and SQL queries
sanjeevanahilan/restorePhotos
Restoring old and blurry face photos with AI.
sanjeevanahilan/avellaneda-stoikov
Avellaneda-Stoikov HFT market making algorithm implementation
sanjeevanahilan/sanic
Async Python 3.7+ web server/framework | Build fast. Run fast.
sanjeevanahilan/spinningup
An educational resource to help anyone learn deep reinforcement learning.
Language:Python
sanjeevanahilan/maddpg-rllib
MADDPG in Ray/RLlib
sanjeevanahilan/multiagent-particle-envs
Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"
sanjeevanahilan/baselines
OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
Language:Python