Joshua-Ren

Pinned Repositories

alignmen_iIWL
Robust recipes to align language models with human and AI preferences
Language:Python0 0 00
better_supervisory_signal
Language:Jupyter Notebook3 2 01
CPSC547_YIREN
Language:Jupyter Notebook0 2 00
finetuning_dynamics
Language:Python00
how_to_prepare_taskhead
2 1 00
iICL
Language:Jupyter Notebook2 2 00
IL_for_MAE
Language:Python1 3 00
Learning_dynamics_LLM
Language:Jupyter Notebook4 1 00
maddpg-again
Language:Jupyter Notebook20
Neural_Iterated_Learning
Pytorch implementation of the paper 'Compositional language emerge in a neural iterated learning' (ICLR 2020).
Language:Python14 3 42

Joshua-Ren's Repositories

Joshua-Ren/Neural_Iterated_Learning
Pytorch implementation of the paper 'Compositional language emerge in a neural iterated learning' (ICLR 2020).
Language:Python14 3 42
Joshua-Ren/Learning_dynamics_LLM
Language:Jupyter Notebook4 1 00
Joshua-Ren/better_supervisory_signal
Language:Jupyter Notebook3 2 01
Joshua-Ren/how_to_prepare_taskhead
2 1 00
Joshua-Ren/iICL
Language:Jupyter Notebook2 2 00
Joshua-Ren/maddpg-again
Language:Jupyter Notebook20
Joshua-Ren/IL_for_MAE
Language:Python1 3 00
Joshua-Ren/alignmen_iIWL
Robust recipes to align language models with human and AI preferences
Language:Python0 0 00
Joshua-Ren/CPSC547_YIREN
Language:Jupyter Notebook0 2 00
Joshua-Ren/finetuning_dynamics
Language:Python00
Joshua-Ren/GPT2_SCAN
Language:Python00
Joshua-Ren/HomePage
Yunhe Wang's HomePage
Language:HTML0 1 00
Joshua-Ren/ICL_toy_my
Language:Python0 1 00
Joshua-Ren/IL_for_SSL
Language:Python00
Joshua-Ren/IPP-Template
Template for the Informatics Project Proposal course
Language:TeX0 1 00
Joshua-Ren/joshua-ren.github.io
Language:CSS00
Joshua-Ren/Knowledge_distill
0 3 00
Joshua-Ren/MNIST_learning_speed_toy
Language:Jupyter Notebook
Joshua-Ren/ms_thesis
Language:Python
Joshua-Ren/my_bvae
my test version of beta-vae
Language:Python3 0
Joshua-Ren/numeral_thesis
Small numeral emergent language game
Language:Jupyter Notebook2 0
Joshua-Ren/P4_GPS
Language:Python2 0
Joshua-Ren/P4_Graph
Language:Jupyter Notebook2 0
Joshua-Ren/P6_TS
Language:Jupyter Notebook1 0
Joshua-Ren/ReinforcementLearningBookExamples
Example codes to implement the examples in Richard's book, Reinforcement Learning: An Introduction.
Language:Python1 0
Joshua-Ren/SimLang
Simulating Language Course
Joshua-Ren/simplicity_bias_learning_dynamics
Language:Jupyter Notebook
Joshua-Ren/SPIN_iIWL
Try SPIN and combine with IL.
Language:Python0 0
Joshua-Ren/ssl_graph
PyTorch implementation of BGRL (https://arxiv.org/abs/2102.06514)
Language:Python1 0
Joshua-Ren/tre_thesis
Tre metric and some fundamental communication games.
Language:Jupyter Notebook1 0