Lab for Interpretability and Theory-Driven Deep Learning

Lab for Interpretability and Theory-Driven Deep Learning, SJTU

China

Pinned Repositories

aog
PyTorch Implementation of the paper "Defining and Quantifying the Emergence of Sparse Concepts in DNNs" (CVPR 2023)
Language:Jupyter Notebook8 0 10
BNN-concepts
PyTorch implementation of the paper "Bayesian Neural Networks Avoid Encoding Complex and Perturbation-Sensitive Concepts" (ICML 2023)
Language:Python1 2 00
generalizable-interaction
PyTorch implementation of the paper "Defining and extracting generalizable interaction primitives from DNNs" (ICLR 2024)
Language:Jupyter Notebook4 0 01
interaction-concept
PyTorch implementation of the paper "Does a Neural Network Really Encode Symbolic Concept?" (ICML 2023)
Language:Jupyter Notebook9 0 10
interaction-sparsity
PyTorch implementation of the paper "Where We Have Arrived in Proving the Emergence of Sparse Interaction Primitives in AI Models" (ICLR 2024)
Language:Python0 1 00
InteractionDynamics
Academic page for the empirical and theoretical findings of the two-phase dynamics of interactions
Language:JavaScript00
ReasoningMemorization
Academic page for Paper: Quantifying In-Context Reasoning Effects and Memorization Effects in LLMs
Language:JavaScript0 0 01
sjtu-xai-lab.github.io
Quanshi Zhang's website. Sjtu interpretable ml lab website.
Language:HTML3 0 01
transformation-complexity
PyTorch implementation of "Towards Theoretical Analysis of Transformation Complexity of ReLU DNNs"
Language:Jupyter Notebook1 1 00
UnifyAttribution
Language:JavaScript0 0 00

Lab for Interpretability and Theory-Driven Deep Learning's Repositories

sjtu-xai-lab/interaction-concept
PyTorch implementation of the paper "Does a Neural Network Really Encode Symbolic Concept?" (ICML 2023)
Language:Jupyter Notebook9 0 10
sjtu-xai-lab/aog
PyTorch Implementation of the paper "Defining and Quantifying the Emergence of Sparse Concepts in DNNs" (CVPR 2023)
Language:Jupyter Notebook8 0 10
sjtu-xai-lab/generalizable-interaction
PyTorch implementation of the paper "Defining and extracting generalizable interaction primitives from DNNs" (ICLR 2024)
Language:Jupyter Notebook4 0 01
sjtu-xai-lab/sjtu-xai-lab.github.io
Quanshi Zhang's website. Sjtu interpretable ml lab website.
Language:HTML3 0 01
sjtu-xai-lab/BNN-concepts
PyTorch implementation of the paper "Bayesian Neural Networks Avoid Encoding Complex and Perturbation-Sensitive Concepts" (ICML 2023)
Language:Python1 2 00
sjtu-xai-lab/Learn
PyTorch implementation of the paper "Towards the Difficulty for a Deep Neural Network to Learn Concepts of Different Complexities" in (NeurIPS 2023)
Language:Python1 1 00
sjtu-xai-lab/transformation-complexity
PyTorch implementation of "Towards Theoretical Analysis of Transformation Complexity of ReLU DNNs"
Language:Jupyter Notebook1 1 00
sjtu-xai-lab/interaction-sparsity
PyTorch implementation of the paper "Where We Have Arrived in Proving the Emergence of Sparse Interaction Primitives in AI Models" (ICLR 2024)
Language:Python0 1 00
sjtu-xai-lab/InteractionDynamics
Academic page for the empirical and theoretical findings of the two-phase dynamics of interactions
Language:JavaScript00
sjtu-xai-lab/ReasoningMemorization
Academic page for Paper: Quantifying In-Context Reasoning Effects and Memorization Effects in LLMs
Language:JavaScript0 0 01
sjtu-xai-lab/UnifyAttribution
Language:JavaScript0 0 00
sjtu-xai-lab/InteractionSparsity
Language:JavaScript

Lab for Interpretability and Theory-Driven Deep Learning

Pinned Repositories

aog

BNN-concepts

generalizable-interaction

interaction-concept

interaction-sparsity

InteractionDynamics

ReasoningMemorization

sjtu-xai-lab.github.io

transformation-complexity

UnifyAttribution

Lab for Interpretability and Theory-Driven Deep Learning's Repositories

sjtu-xai-lab/interaction-concept

sjtu-xai-lab/aog

sjtu-xai-lab/generalizable-interaction

sjtu-xai-lab/sjtu-xai-lab.github.io

sjtu-xai-lab/BNN-concepts

sjtu-xai-lab/Learn

sjtu-xai-lab/transformation-complexity

sjtu-xai-lab/interaction-sparsity

sjtu-xai-lab/InteractionDynamics

sjtu-xai-lab/ReasoningMemorization

sjtu-xai-lab/UnifyAttribution

sjtu-xai-lab/InteractionSparsity