invictus717

Ph.D. Student at MMLab

The Chinese University of HongKongHong Kong

Pinned Repositories

M2PT
[CVPR'24] Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities
Language:Python76 8 14
UniRepLKNet
[CVPR'24] UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition
Language:Python848 12 1651
bidiff
[CVPR'24] Text-to-3D Generation with Bidirectional Diffusion using both 2D and 3D priors
Language:Python149 16 75
BiDiff.github.io
Language:JavaScript1 1 00
GeMap
Online Vectorized HD Map Construction using Geometry
Language:Python152 7 912
OneLLM
[CVPR 2024] OneLLM: One Framework to Align All Modalities with Language
Language:Python488 11 1825
InteractiveVideo
InteractiveVideo: User-Centric Controllable Video Generation with Synergistic Multimodal Instructions
Language:Python118 6 28
MetaTransformer
Meta-Transformer for Unified Multimodal Learning
Language:Python1.5k 22 65113
PointLanguage
20
UniDG
Towards Unified and Effective Domain Generalization
Language:Python26 3 13

invictus717's Repositories

invictus717/MetaTransformer
Meta-Transformer for Unified Multimodal Learning
Language:Python1.5k 22 65113
invictus717/InteractiveVideo
InteractiveVideo: User-Centric Controllable Video Generation with Synergistic Multimodal Instructions
Language:Python118 6 28
invictus717/UniDG
Towards Unified and Effective Domain Generalization
Language:Python26 3 13
invictus717/PointLanguage
20