radarFudan

Machine Learning and Math

NUSSingapore

Pinned Repositories

annotated-mamba
Annotated version of the Mamba paper
Language:Jupyter Notebook2 0 00
Awesome-state-space-models
Collection of papers on state-space models
575 17 520
benchmark_sequence_modeling
Language:Python2 1 00
Curse-of-memory
Curse-of-memory phenomenon of RNNs in sequence modelling
Language:Jupyter Notebook19 2 01
flash-fft-conv
FlashFFTConv: Efficient Convolutions for Long Sequences with Tensor Cores
Language:C++2 0 00
mamba
Language:Python15 0 00
mamba-minimal-jax
Language:Python30 2 10
profiling-cuda-in-torch
Language:Python3 0 00
radarFudan.github.io
Language:HTML3 1 00
S6
Figure out what's next for S6
Language:Python3 1 00

radarFudan's Repositories

radarFudan/Awesome-state-space-models
Collection of papers on state-space models
575 17 520
radarFudan/mamba-minimal-jax
Language:Python30 2 10
radarFudan/Curse-of-memory
Curse-of-memory phenomenon of RNNs in sequence modelling
Language:Jupyter Notebook19 2 01
radarFudan/mamba
Language:Python15 0 00
radarFudan/profiling-cuda-in-torch
Language:Python3 0 00
radarFudan/radarFudan.github.io
Language:HTML3 1 00
radarFudan/annotated-mamba
Annotated version of the Mamba paper
Language:Jupyter Notebook2 0 00
radarFudan/flash-fft-conv
FlashFFTConv: Efficient Convolutions for Long Sequences with Tensor Cores
Language:C++2 0 00
radarFudan/S5
Language:Python2 0 00
radarFudan/attention_with_linear_biases
Code for the ALiBi method for transformer language models (ICLR 2022)
Language:Python1 0 0
radarFudan/causal-conv1d
Causal depthwise conv1d in CUDA, with a PyTorch interface
Language:Cuda1 0 0
radarFudan/EffHDC
Language:Python1 0 0
radarFudan/flash-attention
Fast and memory-efficient exact attention
Language:Python1 0 0
radarFudan/google-research
Google Research
Language:Jupyter Notebook1 0 0
radarFudan/lightning-hydra-template
PyTorch Lightning + Hydra. A very user-friendly template for ML experimentation. ⚡🔥⚡
Language:Python1 0 00
radarFudan/pythia
The hub for EleutherAI's work on interpretability and learning dynamics
Language:Jupyter Notebook1 0 0
radarFudan/RWKV-CUDA
The CUDA version of the RWKV language model ( https://github.com/BlinkDL/RWKV-LM )
Language:Cuda1 0 0
radarFudan/SSM_examples
Language:Jupyter Notebook1 1 01
radarFudan/t5-pegasus-pytorch
Language:Python1 0 0
radarFudan/TinyLlama
The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.
Language:Python1 0 0
radarFudan/transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python1 0 0
radarFudan/triton
Development repository for the Triton language and compiler
Language:Python1 0 0
radarFudan/flash-linear-attention
Efficient implementations of state-of-the-art linear attention models in Pytorch and Triton
Language:Python0 0
radarFudan/gateloop-transformer
Implementation of GateLoop Transformer in Pytorch and Jax
Language:Python0 0
radarFudan/in-context-operator-networks
ICON for in-context operator learning
Language:Python0 0
radarFudan/llm.c
LLM training in simple, raw C/CUDA
Language:Cuda0 0
radarFudan/LongMamba
Some preliminary explorations of Mamba's context scaling.
Language:Python0 0
radarFudan/mamba2-minimal
Minimal Mamba-2 implementation in PyTorch
radarFudan/s4
Structured state space sequence models
Language:Jupyter Notebook0 0
radarFudan/snippets
Language:Jupyter Notebook