ludanruan

Master of Renmin University. Focus on multi-modal understanding and multi-modal generation.

Renmin University of China59 Zhongguancun Street, Haidian District

Pinned Repositories

CLIP4VLA
The official code base of Accommodating Audio Modality in CLIP for Multimodal Processing
Language:Python4 2 21
MCLIP4VLA
Mluti-modal multi-lingual Pre-trained model
Language:Python5 1 01
TTVSR
[CVPR'22 Oral] TTVSR: Learning Trajectory-Aware Transformer for Video Super-Resolution
Language:Python10
MM-Diffusion
[CVPR'23] MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation
Language:Python417 5 2223

ludanruan's Repositories

ludanruan/MCLIP4VLA
Mluti-modal multi-lingual Pre-trained model
Language:Python5 1 01
ludanruan/CLIP4VLA
The official code base of Accommodating Audio Modality in CLIP for Multimodal Processing
Language:Python4 2 21
ludanruan/TTVSR
[CVPR'22 Oral] TTVSR: Learning Trajectory-Aware Transformer for Video Super-Resolution
Language:Python10