KaixiangLin

MICHIGAN STATE UNIVERSITYEAST LANSING

Pinned Repositories

cdrl
Collaborative Deep Reinforcement Learning
Language:Python32 5 011
rpg
Ranking Policy Gradient
Language:Python23 3 01
Simulator
Efficient Large-Scale Fleet Management via Multi-Agent Deep Reinforcement Learning
Language:Python200 9 1574
async-rl
Tensorflow + Keras + OpenAI Gym implementation of 1-step Q Learning from "Asynchronous Methods for Deep Reinforcement Learning"
Language:Python0 2 00
async_deep_reinforce
Asynchronous Methods for Deep Reinforcement Learning
Language:Python1 2 01
FISTA_exercise
Language:MATLAB0 2 03
iMTL
interactive Multi-Task Learning
Language:MATLAB1 2 00
MTIL-example
Multi-Task Feature Interaction Learning -- code example.
Language:MATLAB5 2 02
MTLayerNeuralNet-python
Language:Python1 2 01

KaixiangLin's Repositories

KaixiangLin/federated-learning
Language:Python0 2 00
KaixiangLin/baselines-results
Language:Jupyter Notebook2 0
KaixiangLin/cdrl
Collaborative Deep Reinforcement Learning
Language:Python2 0
KaixiangLin/CogVLM
a state-of-the-art-level open visual language model | 多模态预训练模型
KaixiangLin/cpo
Constrained Policy Optimization
Language:Python2 0
KaixiangLin/cs229t
Statistical Learning Theory (CS229T) Lecture Notes
Language:TeX2 0
KaixiangLin/DeepRLHacks
Hacks for training RL systems from John Schulman's lecture at Deep RL Bootcamp (Aug 2017)
2 0
KaixiangLin/dopamine
Dopamine is a research framework for fast prototyping of reinforcement learning algorithms.
Language:Jupyter Notebook2 0
KaixiangLin/EvalAI-Starters
How to create a challenge on EvalAI?
Language:Python1 0
KaixiangLin/fairseq
Facebook AI Research Sequence-to-Sequence Toolkit written in Python.
Language:Python1 0
KaixiangLin/gym-maze
A customizable gym environment for maze/gridworld
Language:Jupyter Notebook2 0
KaixiangLin/hh-rlhf
Human preference data for "Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback"
1 0
KaixiangLin/KaixiangLin
Config files for my GitHub profile.
2 0
KaixiangLin/kaixianglin.github.io
Personal website.
Language:HTML2 0
KaixiangLin/lantaoyu.github.io
Github Pages template for academic personal websites
Language:JavaScript2 0
KaixiangLin/luminous
2 0
KaixiangLin/magnet
MAGNet: Multi-agents control using Graph Neural Networks
Language:Jupyter Notebook2 0
KaixiangLin/mend
MEND: Fast Model Editing at Scale
Language:Python1 0
KaixiangLin/ml-agents
Unity Machine Learning Agents Toolkit
Language:C#1 01
KaixiangLin/moca
MOCA (Modular Object-Centric Approach) addresses the task of long horizon instruction following with a modular architecture that decouples a task into visual perception and action policy prediction.
Language:C1 0
KaixiangLin/NeuralDialog-ZSDG
PyTorch codebase for zero-shot dialog generation, It is released by Tiancheng Zhao (Tony) from Dialog Research Center, LTI, CMU
Language:Python2 0
KaixiangLin/paper-notes
Random notes on papers, likely a short-term repo.
2 0
KaixiangLin/playground
PlayGround: AI Research into Multi-Agent Learning.
Language:Python2 0
KaixiangLin/project-DRL16
Course project, deep reinforcement learning, open AI gym
Language:Python3 02
KaixiangLin/TC-Bot
User Simulation for Task-Completion Dialogues
Language:OpenEdge ABL2 0
KaixiangLin/trl
Train transformer language models with reinforcement learning.
Language:Jupyter Notebook1 0
KaixiangLin/trlx
A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)
Language:Python1 0
KaixiangLin/universe-starter-agent
A starter agent that can solve a number of universe environments.
Language:Python2 0
KaixiangLin/USTC-Course
:heart:**科学技术大学课程资源
Language:Python2 0
KaixiangLin/virtualhome_unity
Source Code for VirtualHome environment
Language:C#1 0