Multimedia Research

Multimedia Research at Microsoft Research Asia

Pinned Repositories

AOT-GAN-for-Inpainting
[TVCG'2023] AOT-GAN for High-Resolution Image Inpainting (codebase for image inpainting)
Language:Python491 2 2276
img2poem
[MM'18] Beyond Narrative Description: Generating Poetry from Images by Multi-Adversarial Training
Language:Python280 14 1060
LightTrack
[CVPR21] LightTrack: Finding Lightweight Neural Network for Object Tracking via One-Shot Architecture Search
Language:Python435 13 4062
MM-Diffusion
[CVPR'23] MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation
Language:Python442 5 2424
PEN-Net-for-Inpainting
[CVPR'2019] PEN-Net: Learning Pyramid-Context Encoder Network for High-Quality Image Inpainting
Language:Python363 11 3377
SiamDW
[CVPR'19 Oral] Deeper and Wider Siamese Networks for Real-Time Visual Tracking
Language:Python757 23 118178
Stark
[ICCV'21] Learning Spatio-Temporal Transformer for Visual Tracking
Language:Python671 15 108145
STTN
[ECCV'2020] STTN: Learning Joint Spatial-Temporal Transformations for Video Inpainting
Language:Jupyter Notebook526 18 1576
TracKit
[ECCV'20] Ocean: Object-aware Anchor-Free Tracking
Language:Python620 21 11295
TTSR
[CVPR'20] TTSR: Learning Texture Transformer Network for Image Super-Resolution
Language:Python786 13 56115

Multimedia Research's Repositories

researchmm/TTSR
[CVPR'20] TTSR: Learning Texture Transformer Network for Image Super-Resolution
Language:Python786 13 56115
researchmm/SiamDW
[CVPR'19 Oral] Deeper and Wider Siamese Networks for Real-Time Visual Tracking
Language:Python757 23 118178
researchmm/Stark
[ICCV'21] Learning Spatio-Temporal Transformer for Visual Tracking
Language:Python671 15 108145
researchmm/TracKit
[ECCV'20] Ocean: Object-aware Anchor-Free Tracking
Language:Python620 21 11295
researchmm/STTN
[ECCV'2020] STTN: Learning Joint Spatial-Temporal Transformations for Video Inpainting
Language:Jupyter Notebook526 18 1576
researchmm/AOT-GAN-for-Inpainting
[TVCG'2023] AOT-GAN for High-Resolution Image Inpainting (codebase for image inpainting)
Language:Python491 2 2276
researchmm/MM-Diffusion
[CVPR'23] MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation
Language:Python442 5 2424
researchmm/LightTrack
[CVPR21] LightTrack: Finding Lightweight Neural Network for Object Tracking via One-Shot Architecture Search
Language:Python435 13 4062
researchmm/PEN-Net-for-Inpainting
[CVPR'2019] PEN-Net: Learning Pyramid-Context Encoder Network for High-Quality Image Inpainting
Language:Python363 11 3377
researchmm/img2poem
[MM'18] Beyond Narrative Description: Generating Poetry from Images by Multi-Adversarial Training
Language:Python280 14 1060
researchmm/tasn
Trilinear Attention Sampling Network for Fine-grained Image Recognition
Language:Python219 6 1839
researchmm/TTVSR
[CVPR'22 Oral] TTVSR: Learning Trajectory-Aware Transformer for Video Super-Resolution
Language:Python213 6 1312
researchmm/soho
[CVPR'21 Oral] Seeing Out of tHe bOx: End-to-End Pre-training for Vision-Language Representation Learning
Language:Python208 9 1319
researchmm/FTVSR
[ECCV'22] FTVSR: Learning Spatiotemporal Frequency-Transformer for Compressed Video Super-Resolution
Language:Python168 4 3112
researchmm/DBTNet
Code for our NeurIPS'19 paper "Learning Deep Bilinear Transformation for Fine-grained Image Representation"
Language:Python105 5 1318
researchmm/generate-it
A collection of models for image<->text generation in ACM MM 2021.
Language:Python66 3 68
researchmm/CKDN
[ICCV'21] CKDN: Learning Conditional Knowledge Distillation for Degraded-Reference Image Quality Assessment
Language:Python58 3 85
researchmm/SariGAN
[NeurIPS'20] Learning Semantic-aware Normalization for Generative Adversarial Networks
Language:Python54 18 32
researchmm/WSOD2
[ICCV'19] WSOD^2: Learning Bottom-up and Top-down Objectness Distillation for Weakly-supervised Object Detection
Language:Python49 2 43
researchmm/VQD-SR
[ICCV'23] VQD-SR: Learning Data-Driven Vector-Quantized Degradation Model for Animation Video Super-Resolution
Language:Python41 1 63
researchmm/CyDAS
Cyclic Differentiable Architecture Search
Language:Python36 4 26
researchmm/NEAS
Language:Python19 1 15
researchmm/2D-TAN
AAAI2020 - Learning 2D Temporal Localization Networks for Moment Localization with Natural Language
Language:Python17 3 14
researchmm/STTR
[ACCV'22] Fine-Grained Image Style Transfer with Visual Transformers
Language:Python17 2 06
researchmm/AAST-pytorch
[MM'20] Aesthetic-Aware Image Style Transfer
Language:Python15 0 23
researchmm/davinci-videofactory
Language:JavaScript12 1 0
researchmm/AI_Illustrator
[MM'22 Oral] AI Illustrator: Translating Raw Descriptions into Images by Prompt-based Cross-Modal Generation
Language:Python11 1 02
researchmm/language-guided-animation
[TMM 2023] Language-Guided Face Animation by Recurrent StyleGAN-based Generator
Language:Python11 3 20
researchmm/AutoML
AutoFormer, Cream
Language:Python1 0 0
researchmm/2D-TAN-Microsoft
[AAAI‘20] - Learning 2D Temporal Localization Networks for Moment Localization with Natural Language
Language:Python1 0