wz0919

PhD Student

UNC, Chapel Hill

wz0919's Stars

OpenGVLab/InternVL
[CVPR 2024 Oral] InternVL Family: A Pioneering Open-Source Alternative to GPT-4o. 接近GPT-4o表现的开源多模态对话模型
Language:Python7.3k 58 835559
HVision-NKU/StoryDiffusion
Accepted as [NeurIPS 2024] Spotlight Presentation Paper
Language:Jupyter Notebook6.2k 89 152623
lizhe00/AnimatableGaussians
Code of [CVPR 2024] "Animatable Gaussians: Learning Pose-dependent Gaussian Maps for High-fidelity Human Avatar Modeling"
Language:Python979 41 5164
OpenGVLab/VideoMamba
[ECCV2024] VideoMamba: State Space Model for Efficient Video Understanding
Language:Python917 12 10369
hitcslj/Awesome-AIGC-3D
A curated list of awesome AIGC 3D papers
642 25 024
OpenRobotLab/EmbodiedScan
[CVPR 2024 & NeurIPS 2024] EmbodiedScan: A Holistic Multi-Modal 3D Perception Suite Towards Embodied AI
Language:Python562 6 7841
concept-graphs/concept-graphs
Official code release for ConceptGraphs
Language:Python542 8 7282
vlmaps/vlmaps
[ICRA2023] Implementation of Visual Language Maps for Robot Navigation
Language:Python443 11 6555
Vchitect/Vlogger
[CVPR2024] Make Your Dream A Vlog
Language:Python422 10 1646
HL-hanlin/Ctrl-Adapter
Official implementation of Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model (ICLR 2025 Oral)
Language:Python421 21 2516
OpenGVLab/InternVideo2
215 25 32
google-deepmind/perception_test
Language:Jupyter Notebook202 9 2515
zd11024/NaviLLM
[CVPR 2024] The code for paper 'Towards Learning a Generalist Model for Embodied Navigation'
Language:Python161 4 2312
GengzeZhou/NavGPT-2
[ECCV 2024] Official implementation of NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models
Language:Python131 7 79
UMass-Foundation-Model/MultiPLY
Code for MultiPLY: A Multisensory Object-Centric Embodied Large Language Model in 3D World
Language:Python126 11 56
DefaultRui/VLN-VER
[CVPR24] Volumetric Environment Representation for Vision-Language Navigation
Language:Python88 3 68
MrZihan/GridMM
Official implementation of GridMM: Grid Memory Map for Vision-and-Language Navigation (ICCV'23).
Language:Python80 3 151
CrystalSixone/VLN-GOAT
Repository for Vision-and-Language Navigation via Causal Learning (Accepted by CVPR 2024)
Language:Python64 3 138
MrZihan/HNR-VLN
Official implementation of Lookahead Exploration with Neural Radiance Representation for Continuous Vision-Language Navigation (CVPR'24 Highlight).
Language:Python61 3 130
OpenGVLab/EgoExoLearn
[CVPR 2024] Data and benchmark code for the EgoExoLearn dataset
Language:Python54 2 80
JeremyLinky/YouTube-VLN
[ICCV'23] Learning Vision-and-Language Navigation from YouTube Videos
Language:Python51 3 81
MrZihan/Sim2Real-VLN-3DFF
Official implementation of Sim-to-Real Transfer via 3D Feature Fields for Vision-and-Language Navigation (CoRL'24).
Language:Python49 2 92
jaehong31/RACCooN
(arXiv.2405.18406) RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives
Language:Python34 2 81
jialuli-luka/SELMA
Code and Data for Paper: SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with Auto-Generated Data
Language:Python33 3 12
OpenRobotLab/OVExp
OVExp: Open Vocabulary Exploration for Object-Oriented Navigation
33 6 10
vlc-robot/polarnet
[CoRL2023] Official PyTorch implementation of PolarNet: 3D Point Clouds for Language-Guided Robotic Manipulation
Language:Python32 2 60
CrystalSixone/DSRG
Code for A Dual Semantic-Aware Recurrent Global-Adaptive Network For Vision-and-Language Navigation
Language:Python16 2 80
iSEE-Laboratory/VLN-PRET
Language:Jupyter Notebook14 1 03
CrystalSixone/VLN-MAGIC
This is the official repository for MAGIC: Meta-Ability Guided Interactive Chain-of-Distillation Learning towards Efficient Vision-and-Language Navigation
Language:Python10 3 30
Zhangzeyu97/CBD
Code for Strong and Controllable Blind Image Decomposition
6 2 10

wz0919

wz0919's Stars

OpenGVLab/InternVL

HVision-NKU/StoryDiffusion

lizhe00/AnimatableGaussians

OpenGVLab/VideoMamba

hitcslj/Awesome-AIGC-3D

OpenRobotLab/EmbodiedScan

concept-graphs/concept-graphs

vlmaps/vlmaps

Vchitect/Vlogger

HL-hanlin/Ctrl-Adapter

OpenGVLab/InternVideo2

google-deepmind/perception_test

zd11024/NaviLLM

GengzeZhou/NavGPT-2

UMass-Foundation-Model/MultiPLY

DefaultRui/VLN-VER

MrZihan/GridMM

CrystalSixone/VLN-GOAT

MrZihan/HNR-VLN

OpenGVLab/EgoExoLearn

JeremyLinky/YouTube-VLN

MrZihan/Sim2Real-VLN-3DFF

jaehong31/RACCooN

jialuli-luka/SELMA

OpenRobotLab/OVExp

vlc-robot/polarnet

CrystalSixone/DSRG

iSEE-Laboratory/VLN-PRET

CrystalSixone/VLN-MAGIC

Zhangzeyu97/CBD