achen46

Pinned Repositories

efficientvit
EfficientViT is a new family of vision models for efficient high-resolution vision.
Language:Python0 0 00
FasterViT
Official PyTorch implementation of FasterViT: Fast Vision Transformers with Hierarchical Attention
Language:Python0 0 00
GCVit
Official PyTorch implementation of Global Context Vision Transformers
Language:Python0 0 00
Neighborhood-Attention-Transformer
[Preprint] Neighborhood Attention Transformer
Language:Python0 0 00
DiT
Official PyTorch Implementation of "Scalable Diffusion Models with Transformers"
Language:Python6.6k 44 83594
VAR
[NeurIPS 2024 Oral][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultra-simple, user-friendly yet state-of-the-art* codebase for autoregressive image generation!
Language:Jupyter Notebook6.5k 120 108433
MDT
Masked Diffusion Transformer is the SOTA for image synthesis. (ICCV 2023)
Language:Python536 17 5240
OneFormer
[CVPR 2023] OneFormer: One Transformer to Rule Universal Image Segmentation
Language:Jupyter Notebook1.5k 20 118134
sd-webui-cads
Greatly increase the diversity of your generated images in Automatic1111 WebUI through Condition-Annealed Sampling.
Language:Python103 5 177

achen46's Repositories

achen46/efficientvit
EfficientViT is a new family of vision models for efficient high-resolution vision.
Language:Python0 0 00
achen46/FasterViT
Official PyTorch implementation of FasterViT: Fast Vision Transformers with Hierarchical Attention
Language:Python0 0 00
achen46/GCVit
Official PyTorch implementation of Global Context Vision Transformers
Language:Python0 0 00
achen46/Neighborhood-Attention-Transformer
[Preprint] Neighborhood Attention Transformer
Language:Python0 0 00