FAR AI

FAR AI is an alignment research non-profit working to ensure AI systems are trustworthy and beneficial to society.

Pinned Repositories

epic
Implements the Equivalent-Policy Invariant Comparison (EPIC) distance for reward functions.
Language:Python2 3 23
go_attack
Language:Python75 9 166
gpt-4-novel-apis-attacks
141
KataGo-custom
Child repository of https://github.com/HumanCompatibleAI/go_attack.
Language:C++4 5 140
KataGoVisualizer
Language:HTML3 4 101
learned-planners-stable-baselines3
PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.
Language:Python2 0 00
magicwormhole-docker
Dockerfile for Magic Wormhole
Language:Dockerfile1 2 00
stable-baselines3
PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.
Language:Python1 1 02
tuned-lens
Tools for understanding how transformer predictions are built layer-by-layer
Language:Python386 6 5337
vlmrm
Language:Python30 4 210

FAR AI's Repositories

AlignmentResearch/tuned-lens
Tools for understanding how transformer predictions are built layer-by-layer
Language:Python386 6 5337
AlignmentResearch/go_attack
Language:Python75 9 166
AlignmentResearch/vlmrm
Language:Python30 4 210
AlignmentResearch/gpt-4-novel-apis-attacks
141
AlignmentResearch/KataGo-custom
Child repository of https://github.com/HumanCompatibleAI/go_attack.
Language:C++4 5 140
AlignmentResearch/KataGoVisualizer
Language:HTML3 4 101
AlignmentResearch/epic
Implements the Equivalent-Policy Invariant Comparison (EPIC) distance for reward functions.
Language:Python2 3 23
AlignmentResearch/learned-planners-stable-baselines3
PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.
Language:Python2 0 00
AlignmentResearch/alpaca-lora
Instruct-tune LLaMA on consumer hardware
Language:Jupyter Notebook1 1 00
AlignmentResearch/farconf
Easy dataclass-based configuration for ML projects
Language:Python1
AlignmentResearch/gogui
Graphical user interface for the game of Go, and other similar board games
Language:Java1 1 00
AlignmentResearch/magicwormhole-docker
Dockerfile for Magic Wormhole
Language:Dockerfile1 2 00
AlignmentResearch/pgx
A collection of highly-parallel RL game environments written in JAX
Language:Python1 1 00
AlignmentResearch/stable-baselines3
PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.
Language:Python1 1 02
AlignmentResearch/ELF
ELF: a platform for game research with AlphaGoZero/AlphaZero reimplementation
Language:C++1 0
AlignmentResearch/envpool
C++-based high-performance parallel environment execution engine (vectorized env) for general RL environments.
Language:C++
AlignmentResearch/gym-sokoban
Sokoban environment for Gym
Language:Jupyter Notebook0 0
AlignmentResearch/kueue
Kubernetes-native Job Queueing
Language:Go0 0
AlignmentResearch/leela-zero
Go engine with no human-provided knowledge, modeled after the AlphaGo Zero paper.
Language:C++1 0
AlignmentResearch/MambaLens
Mamba support for transformer lens
AlignmentResearch/mats_sae_training
Training Sparse Autoencoders on Language Models
AlignmentResearch/polygames
Language:C++1 221
AlignmentResearch/sae-k-sparse-mamba
K-Sparse Autoencoders for Mamba
Language:Python
AlignmentResearch/SimpleParsing
Simple, Elegant, Typed Argument Parsing with argparse
Language:Python1 0

FAR AI

Pinned Repositories

epic

go_attack

gpt-4-novel-apis-attacks

KataGo-custom

KataGoVisualizer

learned-planners-stable-baselines3

magicwormhole-docker

stable-baselines3

tuned-lens

vlmrm

FAR AI's Repositories

AlignmentResearch/tuned-lens

AlignmentResearch/go_attack

AlignmentResearch/vlmrm

AlignmentResearch/gpt-4-novel-apis-attacks

AlignmentResearch/KataGo-custom

AlignmentResearch/KataGoVisualizer

AlignmentResearch/epic

AlignmentResearch/learned-planners-stable-baselines3

AlignmentResearch/alpaca-lora

AlignmentResearch/farconf

AlignmentResearch/gogui

AlignmentResearch/magicwormhole-docker

AlignmentResearch/pgx

AlignmentResearch/stable-baselines3

AlignmentResearch/ELF

AlignmentResearch/envpool

AlignmentResearch/gym-sokoban

AlignmentResearch/kueue

AlignmentResearch/leela-zero

AlignmentResearch/MambaLens

AlignmentResearch/mats_sae_training

AlignmentResearch/polygames

AlignmentResearch/sae-k-sparse-mamba

AlignmentResearch/SimpleParsing