OpenPipe

Pinned Repositories

ART
Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen2.5, Qwen3, Llama, and more!
Language:Python7.8k 43 101599
art-notebooks
Notebooks to demonstrate ART (Agent Reinforcement Trainer) in practice!
Language:Shell6 0 04
best-hn
Language:Jupyter Notebook10 1 01
deductive-reasoning
Train your own SOTA deductive reasoning model
Language:Python108 2 18
email-deep-research
Language:Python202
open_deep_research_training
Training setup for Langchain's Open Deep Research
Language:Python6917
OpenPipe
Turn expensive prompts into cheap fine-tuned models
Language:TypeScript2.7k 20 57160
pii-redaction
Detect and redact PII locally with SOTA performance
Language:Python80 2 114
rl-experiments
OpenPipe Reinforcement Learning Experiments
Language:Jupyter Notebook32 3 05
Summary-RL
Train an agent to generate high quality summaries
Language:Jupyter Notebook38 3 010

OpenPipe's Repositories

OpenPipe/ART
Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen2.5, Qwen3, Llama, and more!
Language:Python7.8k 43 101599
OpenPipe/OpenPipe
Turn expensive prompts into cheap fine-tuned models
Language:TypeScript2.7k 20 57160
OpenPipe/deductive-reasoning
Train your own SOTA deductive reasoning model
Language:Python108 2 18
OpenPipe/pii-redaction
Detect and redact PII locally with SOTA performance
Language:Python80 2 114
OpenPipe/open_deep_research_training
Training setup for Langchain's Open Deep Research
Language:Python6917
OpenPipe/Summary-RL
Train an agent to generate high quality summaries
Language:Jupyter Notebook38 3 010
OpenPipe/rl-experiments
OpenPipe Reinforcement Learning Experiments
Language:Jupyter Notebook32 3 05
OpenPipe/email-deep-research
Language:Python202
OpenPipe/best-hn
Language:Jupyter Notebook10 1 01
OpenPipe/art-notebooks
Notebooks to demonstrate ART (Agent Reinforcement Trainer) in practice!
Language:Shell6 0 04
OpenPipe/art-langgraph
Language:Python5 0 00
OpenPipe/step-one
This repo is only used for searching reddit
Language:Python3 0 01
OpenPipe/trpc-openapi
OpenAPI support for tRPC 🧩 - with streaming :)
Language:TypeScript2 1 01
OpenPipe/art-star-count
Display ART repository star count on a tablet
Language:HTML1
OpenPipe/tsoa
Build OpenAPI-compliant REST APIs using TypeScript and Node
Language:TypeScript1 1 00
OpenPipe/vllm-lora
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python1 0 00
OpenPipe/alpaca_eval
An automatic evaluator for instruction-following language models. Human-validated, high-quality, cheap, and fast.
Language:Jupyter Notebook0 0 00
OpenPipe/axolotl
Go ahead and axolotl questions
Language:Python0 1 00
OpenPipe/mistral-client-js
JS Client library for Mistral AI platform
Language:JavaScript0 0 00
OpenPipe/openapi-typescript-codegen
NodeJS library that generates Typescript or Javascript clients based on the OpenAPI specification
Language:TypeScript0 0 01
OpenPipe/trl
Train transformer language models with reinforcement learning.
Language:Python0 0 00
OpenPipe/vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python0 0 00
OpenPipe/vllm-completions
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python0 0 01
OpenPipe/ArcticInference
Language:Python0 0
OpenPipe/S3LoRAResolver
Language:Python
OpenPipe/sglang
SGLang is a fast serving framework for large language models and vision language models.
Language:Python
OpenPipe/skypilot-catalog
OpenPipe/verl
verl: Volcano Engine Reinforcement Learning for LLMs
Language:Python