misraya/baby_lm

Pre-training language models with limited data

Jupyter Notebook

BabyLM Challenge

Pre-training language models with limited data

Dataset exploration
Tokenizer analysis
Baseline training
Tuning with task rewards