sparse-autoencoder

There are 27 repositories under sparse-autoencoder topic.

PaulPauls/llama3_interpretability_sae
A complete end-to-end pipeline for LLM interpretability with sparse autoencoders (SAEs) using Llama 3.2, written in pure PyTorch and fully reproducible.
605 5 134
vgel/repeng
A library for making RepE control vectors
Language:Jupyter Notebook526 6 3041
ruizheliUOA/Awesome-Interpretability-in-Large-Language-Models
This repository collects all relevant resources about interpretability in LLMs
304 5 419
wblgers/tensorflow_stacked_denoising_autoencoder
Implementation of the stacked denoising autoencoder in Tensorflow
Language:Python202 4 383
syorami/Autoencoders-Variants
Pytorch implementations of various types of autoencoders
Language:Python67 2 525
glami/sansa
SANSA - sparse EASE for millions of items
Language:Python37 8 24
explanare/ravel
Evaluate interpretability methods on localizing and disentangling concepts in LLMs.
Language:Python34 1 16
khoink94/tensorflow-Deep-learning
Tensorflow Examples
Language:Python29 1 111
mrquincle/keras-adversarial-autoencoders
Experiments with Adversarial Autoencoders using Keras
Language:Jupyter Notebook22 3 113
snooky23/K-Sparse-AutoEncoder
Sparse Auto Encoder and regular MNIST classification with mini batch's
Language:Jupyter Notebook22 2 19
tim-lawson/mlsae
Multi-Layer Sparse Autoencoders
Language:Python14 2 60
shantanu-ai/DPN-SA
Repository of Deep Propensity Network - Sparse Autoencoder(DPN-SA) to calculate propensity score using sparse autoencoder
Language:Python10 1 03
zer0int/CLIP-SAE-finetune
Sparse Autoencoders (SAE) vs CLIP fine-tuning fun.
Language:Python102
MaheepChaudhary/SAE-Ravel
Providing the answer to "How to do patching on all available SAEs on GPT-2?". It is an official repository of the implementation of the paper "Evaluating Open-Source Sparse Autoencoders on Disentangling Factual Knowledge in GPT-2 Small"
Language:Python8 1 01
Ki-Seki/Awesome-Transformer-Visualization
Explore visualization tools for understanding Transformer-based large language models (LLMs)
7 1 01
ALPHAYA-Japan/autoencoders
Collection of autoencoder models in Tensorflow
Language:Python5 3 01
Butanium/tiny-activation-dashboard
A tiny easily hackable implementation of a feature dashboard.
Language:Python5 1 00
chrisliu298/awesome-sparse-autoencoders
A resource repository of sparse autoencoders for large language models
3 1 00
vivekamin/semi-supervised-learning
Implemented semi-supervised learning for digit recognition using Sparse Autoencoder
Language:Python3 0 00
aarnphm/tinymorph
exploration WYSIWYG editor
Language:Jupyter Notebook2 1 670
seonglae/emgsd-hermes
Steering GPT2-EMGSD less biased & Generating stereotyped text with vanilla GPT2 without fine tuning or prompt engineering
Language:Jupyter Notebook20
sushantMoon/isi-nna
Neural Network Architcture | ISI Kolkata
Language:Jupyter Notebook2 2 00
cxcscmu/embedding-scope
Interpret and control dense embedding via sparse autoencoder.
Language:Python1
SayanChakraborty126/ML-CODES
This repository contains Python codes for Autoenncoder, Sparse-autoencoder, HMM, Expectation-Maximization, Sum-product Algorithm, ANN, Disparity map, PCA.
Language:Jupyter Notebook1 1 00
Specoptor/bot-iot
Implement a sparse autoencoder on the bot-iot dataset for dimensionality reduction followed by computation of reconstruction error, F1 score, recall, accuracy, weights, and threshold amongst other metrics
Language:Jupyter Notebook0 1 00
sskrishn/Neural-Networks
Folder contains implementation of Multi layer feed forward networks, Autoencoders, Sparse Autoencoders and many..
Language:HTML0 1 00
mcanalesmayo/SparseAutoencoder
Sparse Autoencoder based on the Unsupervised Feature Learning and Deep Learning tutorial from the Stanford University
Language:MATLAB2 0

sparse-autoencoder

PaulPauls/llama3_interpretability_sae

vgel/repeng

ruizheliUOA/Awesome-Interpretability-in-Large-Language-Models

wblgers/tensorflow_stacked_denoising_autoencoder

syorami/Autoencoders-Variants

glami/sansa

explanare/ravel

khoink94/tensorflow-Deep-learning

mrquincle/keras-adversarial-autoencoders

snooky23/K-Sparse-AutoEncoder

tim-lawson/mlsae

shantanu-ai/DPN-SA

zer0int/CLIP-SAE-finetune

MaheepChaudhary/SAE-Ravel

Ki-Seki/Awesome-Transformer-Visualization

ALPHAYA-Japan/autoencoders

Butanium/tiny-activation-dashboard

chrisliu298/awesome-sparse-autoencoders

vivekamin/semi-supervised-learning

aarnphm/tinymorph

seonglae/emgsd-hermes

sushantMoon/isi-nna

cxcscmu/embedding-scope

SayanChakraborty126/ML-CODES

Specoptor/bot-iot

sskrishn/Neural-Networks

mcanalesmayo/SparseAutoencoder