loss-landscape

There are 15 repositories under loss-landscape topic.

xxxnell/how-do-vits-work
(ICLR 2022 Spotlight) Official PyTorch implementation of "How Do Vision Transformers Work?"
Language:Python808 7 4379
logancyang/loss-landscape-anim
Create animations for the optimization trajectory of neural nets
Language:Python141 3 323
ayulockin/LossLandscape
Explores the ideas presented in Deep Ensembles: A Loss Landscape Perspective (https://arxiv.org/abs/1912.02757) by Stanislav Fort, Huiyi Hu, and Balaji Lakshminarayanan.
Language:Jupyter Notebook62 4 04
sayakpaul/Sharpness-Aware-Minimization-TensorFlow
Implements sharpness-aware minimization (https://arxiv.org/abs/2010.01412) in TensorFlow 2.
Language:Jupyter Notebook60 3 812
shamsbasir/investigating_mitigating_failure_modes_in_pinns
This repository contains the code and models for our paper "Investigating and Mitigating Failure Modes in Physics-informed Neural Networks(PINNs)"
Language:Jupyter Notebook16 6 05
VITA-Group/LTH-Pass
[TMLR] "Can You Win Everything with Lottery Ticket?" by Tianlong Chen, Zhenyu Zhang, Jun Wu, Randy Huang, Sijia Liu, Shiyu Chang, Zhangyang Wang
Language:Python10 7 02
gg-dema/Git_merge
analytic solution to the git-merge algorithm, derived from "Git Re-Basin: Merging Models modulo Permutation Symmetries"
Language:Jupyter Notebook4 1 00
isadrtdinov/understanding-large-lrs
Source code for NeurIPS-2024 paper "Where Do Large Learning Rates Lead Us"
Language:Jupyter Notebook4 1 00
sungyoon-lee/LossLandscapeMatters
[NeurIPS 2021] Towards Better Understanding of Training Certifiably Robust Models against Adversarial Examples | ⛰️⚠️
Language:Python4 2 12
fanghenshaometeor/ood-mode-ensemble
[Int. J. Comput. Vis. 2024] Revisiting Deep Ensemble for Out-of-Distribution Detection: A Loss Landscape Perspective
Language:Python3 1 01
HJHGJGHHG/Optimizer-papers
Worth-reading papers and related awesome resources on deep learning optimization algorithms. 值得一读的深度学习优化器论文与相关资源。
Language:Python3 2 00
mortfer/keras-gsam
Surrogate Gap Guided Sharpness-Aware Minimization (GSAM) implementation for keras/tensorflow 2
Language:Python3 1 02
pxl-th/Yama.jl
Visualize loss landscape
Language:Julia1 3 01
francesco-innocenti/pc-saddles
Code for NeurIPS 2024 paper "Only Strict Saddles in the Energy Landscape of Predictive Coding Networks?"
Language:Jupyter Notebook
HuanranLi/Grokking-in-Transformer
This project builds on recent research that explores the phenomenon of Grokking. The goal is to investigate when, why, and how grokking occurs, focusing on transformers under various batch sizes.
Language:Python

loss-landscape

xxxnell/how-do-vits-work

logancyang/loss-landscape-anim

ayulockin/LossLandscape

sayakpaul/Sharpness-Aware-Minimization-TensorFlow

shamsbasir/investigating_mitigating_failure_modes_in_pinns

VITA-Group/LTH-Pass

gg-dema/Git_merge

isadrtdinov/understanding-large-lrs

sungyoon-lee/LossLandscapeMatters

fanghenshaometeor/ood-mode-ensemble

HJHGJGHHG/Optimizer-papers

mortfer/keras-gsam

pxl-th/Yama.jl

francesco-innocenti/pc-saddles

HuanranLi/Grokking-in-Transformer