koalazf99

AI Research @GAIR-NLP | Ex @microsoft, @xlang-ai

Shanghai Jiao Tong UniversityShanghai

Pinned Repositories

ProX
Offical Repo for "Programming Every Example: Lifting Pre-training Data Quality Like Experts at Scale"
Language:Python205 6 615
TinyLlama
The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.
Language:Python8.1k 110 158483
amber-train
Pre-training code for Amber 7B LLM
Language:Python0 0 00
Awesome-DataCentric-LLM
Trending projects & awesome papers about data-centric llm studies.
31 3 02
awesome-llm-powered-agent
Awesome things about LLM-powered agents. Papers / Repos / Blogs / ...
0 0 00
CS385Projects
Independent Projects for SJTU CS385
Language:Python4 2 00
tacube
[EMNLP 2022] TaCube: Pre-computing Data Cubes for Answering Numerical-Reasoning Questions over Tabular Data
17 4 10
Lemur
[ICLR 2024] Lemur: Open Foundation Models for Language Agents
Language:Python539 9 635
symbolic-instruction-tuning
The official repository for the paper "From Zero to Hero: Examining the Power of Symbolic Tasks in Instruction Tuning".
Language:Python63 5 13
OpenAgents
[COLM 2024] OpenAgents: An Open Platform for Language Agents in the Wild
Language:Python4k 47 98454

koalazf99's Repositories

koalazf99/Awesome-DataCentric-LLM
Trending projects & awesome papers about data-centric llm studies.
31 3 02
koalazf99/tacube
[EMNLP 2022] TaCube: Pre-computing Data Cubes for Answering Numerical-Reasoning Questions over Tabular Data
17 4 10
koalazf99/CS385Projects
Independent Projects for SJTU CS385
Language:Python4 2 00
koalazf99/amber-train
Pre-training code for Amber 7B LLM
Language:Python0 0 00
koalazf99/awesome-llm-powered-agent
Awesome things about LLM-powered agents. Papers / Repos / Blogs / ...
0 0 00
koalazf99/CodeQwen1.5
CodeQwen1.5 is the code version of Qwen, the large language model series developed by Qwen team, Alibaba Cloud.
Language:Python0 0 00
koalazf99/cs2916
Language:Python0 0 00
koalazf99/datasets
🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data manipulation tools
Language:Python0 1 00
koalazf99/datatrove
Freeing data processing from scripting madness by providing a set of platform-agnostic customizable pipeline processing blocks.
Language:Python0 0 00
koalazf99/dbt-test
Language:Python0 1 00
koalazf99/koalazf99.github.io
Personal Page
Language:SCSS0 2 01
koalazf99/LLM-Agent-Survey
0 0 00
koalazf99/openai-cookbook
Examples and guides for using the OpenAI API
Language:Jupyter Notebook0 0 00
koalazf99/code-llm-contamination
koalazf99/dspy
DSPy: The framework for programming—not prompting—foundation models
Language:Python0 0
koalazf99/ebooks
收藏的一些经典的历史、政治、心理、哲学、数学、计算机方面电子书(约10万本）
Language:JavaScript0 0
koalazf99/k2-train
Language:Python0 0
koalazf99/LLaVA
[NeurIPS'23 Oral] Visual Instruction Tuning (LLaVA) built towards GPT-4V level capabilities and beyond.
Language:Python0 0
koalazf99/llm-swarm
Manage scalable open LLM inference endpoints in Slurm clusters
Language:Python0 0
koalazf99/magpie
Official repository for "Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing". Your efficient and high-quality synthetic data generation pipeline!
koalazf99/mink
This repository provides an original implementation of Detecting Pretraining Data from Large Language Models by *Weijia Shi, *Anirudh Ajith, Mengzhou Xia, Yangsibo Huang, Daogao Liu , Terra Blevins , Danqi Chen , Luke Zettlemoyer.
koalazf99/open-interpreter
OpenAI's Code Interpreter in your terminal, running locally
Language:Python0 0
koalazf99/prismatic-vlms
A flexible and efficient codebase for training visually-conditioned language models (VLMs)
Language:Python0 0
koalazf99/sailcraft
Data Toolkit for Sailor Language Models
Language:Python0 0
koalazf99/temp-open-instruct
temp-fork
Language:Python0 0
koalazf99/TinyLlama
The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.
Language:Python0 0

koalazf99

Pinned Repositories

ProX

TinyLlama

amber-train

Awesome-DataCentric-LLM

awesome-llm-powered-agent

CS385Projects

tacube

Lemur

symbolic-instruction-tuning

OpenAgents

koalazf99's Repositories

koalazf99/Awesome-DataCentric-LLM

koalazf99/tacube

koalazf99/CS385Projects

koalazf99/amber-train

koalazf99/awesome-llm-powered-agent

koalazf99/CodeQwen1.5

koalazf99/cs2916

koalazf99/datasets

koalazf99/datatrove

koalazf99/dbt-test

koalazf99/koalazf99.github.io

koalazf99/LLM-Agent-Survey

koalazf99/openai-cookbook

koalazf99/code-llm-contamination

koalazf99/dspy

koalazf99/ebooks

koalazf99/k2-train

koalazf99/LLaVA

koalazf99/llm-swarm

koalazf99/magpie

koalazf99/mink

koalazf99/open-interpreter

koalazf99/prismatic-vlms

koalazf99/sailcraft

koalazf99/temp-open-instruct

koalazf99/TinyLlama