sandrawing

MS in Data Science @ Harvard University, B. Econ in Finance, Minor in Mathematics @ Nankai University

sandrawing's Stars

openai/gym
A toolkit for developing and comparing reinforcement learning algorithms.
Language:Python34.8k 1.1k 1.8k8.6k
jindongwang/transferlearning
Transfer learning / domain adaptation / domain generalization / multi-task learning etc. Papers, codes, datasets, applications, tutorials.-迁移学习
Language:Python13.5k 339 3393.8k
google-research/simclr
SimCLRv2 - Big Self-Supervised Models are Strong Semi-Supervised Learners
Language:Jupyter Notebook4.1k 47 197624
ieee8023/covid-chestxray-dataset
We are building an open database of COVID-19 cases with chest X-ray or CT images.
Language:Jupyter Notebook3k 156 1121.3k
openai/multiagent-particle-envs
Code for a multi-agent particle environment used in the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"
Language:Python2.4k 176 84786
oxwhirl/pymarl
Python Multi-Agent Reinforcement Learning framework
Language:Python1.9k 29 130384
openai/multi-agent-emergence-environments
Environment generation code for the paper "Emergent Tool Use From Multi-Agent Autocurricula"
Language:Python1.6k 187 31308
openai/maddpg
Code for the MADDPG algorithm from the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"
Language:Python1.6k 150 67489
quantumiracle/Popular-RL-Algorithms
PyTorch implementation of Soft Actor-Critic (SAC), Twin Delayed DDPG (TD3), Actor-Critic (AC/A2C), Proximal Policy Optimization (PPO), QT-Opt, PointNet..
Language:Jupyter Notebook1.1k 15 21128
PaddlePaddle/RocketQA
🚀 RocketQA, dense retrieval for information retrieval and question answering, including both Chinese and English state-of-the-art models.
Language:Python767 19 107128
lucidrains/mixture-of-experts
A Pytorch implementation of Sparsely-Gated Mixture of Experts, for massively increasing the parameter count of language models
Language:Python640 6 1149
acl-org/aclpubcheck
Tools for checking ACL paper submissions
Language:Python598 5 4747
shariqiqbal2810/maddpg-pytorch
PyTorch Implementation of MADDPG (Lowe et. al. 2017)
Language:Python573 5 43129
starry-sky6688/MADDPG
Pytorch implementation of the MARL algorithm, MADDPG, which correspondings to the paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments".
Language:Python538 5 4283
aravindr93/mjrl
Reinforcement learning algorithms for MuJoCo tasks
Language:Python361 16 25102
brucechou1983/CheXNet-Keras
This project is a tool to build CheXNet-like models, written in Keras.
Language:Python294 24 41145
aravindr93/hand_dapg
Repository to accompany RSS 2018 paper on dexterous hand manipulation
Language:Python227 7 931
chijames/Poly-Encoder
Language:Python164 5 1232
semitable/lb-foraging
Level-based Foraging (LBF): A multi-agent environment for RL
Language:Python159 3 1865
richardrl/rlkit-relational
Codebase for ICRA 2020 paper "Towards Practical Multi-object Manipulation using Relational Reinforcement Learning"
Language:Python97 7 710
fasrc/User_Codes
Language:Jupyter Notebook77 16 1217
Bigpig4396/PyTorch-Counterfactual-Multi-Agent-Policy-Gradients-COMA
Language:Python71 2 414
matteokarldonati/Counterfactual-Multi-Agent-Policy-Gradients
PyTorch implementation of Foerster, Jakob N., et al. "Counterfactual multi-agent policy gradients."
Language:Jupyter Notebook53 3 311
UBS-IB/bayesian_tree
Language:Python49 7 114
johnny12150/GC-SAN
An implementation trying to reproduce "Graph contextualized self-attention network for session-based recommendation" based on SR-GNN code.
Language:Python46 0 316
AmazaspShumik/Mixture-Models
Hierarchical Mixture of Experts,Mixture Density Neural Network
Language:Jupyter Notebook45 3 1217
taochenshh/easyrl
A collection of reinforcement learning algorithms.
Language:Python9 2 18
Steven-Ho/coma
Multi-agent algorithm based on counterfactual multi-agent policy gradients
Language:Python7 5 11
Gialbo/COVID-Chest-X-Rays-Deep-Learning-analysis
Comparison and Analysis of different Deep Learning techniques for the COVID-19 Chest X-Rays dataset
Language:Jupyter Notebook2 1 10
quantumsnowball/toy-datasets-collections
A toy datasets collections for machine learning research quick reference
Language:Jupyter Notebook2 1 0

sandrawing

sandrawing's Stars

openai/gym

jindongwang/transferlearning

google-research/simclr

ieee8023/covid-chestxray-dataset

openai/multiagent-particle-envs

oxwhirl/pymarl

openai/multi-agent-emergence-environments

openai/maddpg

quantumiracle/Popular-RL-Algorithms

PaddlePaddle/RocketQA

lucidrains/mixture-of-experts

acl-org/aclpubcheck

shariqiqbal2810/maddpg-pytorch

starry-sky6688/MADDPG

aravindr93/mjrl

brucechou1983/CheXNet-Keras

aravindr93/hand_dapg

chijames/Poly-Encoder

semitable/lb-foraging

richardrl/rlkit-relational

fasrc/User_Codes

Bigpig4396/PyTorch-Counterfactual-Multi-Agent-Policy-Gradients-COMA

matteokarldonati/Counterfactual-Multi-Agent-Policy-Gradients

UBS-IB/bayesian_tree

johnny12150/GC-SAN

AmazaspShumik/Mixture-Models

taochenshh/easyrl

Steven-Ho/coma

Gialbo/COVID-Chest-X-Rays-Deep-Learning-analysis

quantumsnowball/toy-datasets-collections