Om AI Lab

Open Multimodal AGI Research

Pinned Repositories

awesome-RSVLM
Collection of Remote Sensing Vision-Language Models
139 8 04
GroundVLP
GroundVLP: Harnessing Zero-shot Visual Grounding from Vision-Language Pre-training and Open-Vocabulary Object Detection (AAAI 2024)
Language:Jupyter Notebook71 4 45
OmAgent
Build multimodal language agents for fast prototype and production
Language:Python2.6k 132 31281
OmDet
Real-time and accurate open-vocabulary end-to-end object detection
Language:Python1.3k 68 24109
OmModel
A collection of strong multimodal models for building multimodal AGI agents
43 5 11
OVDEval
A Comprehensive Evaluation Benchmark for Open-Vocabulary Detection (AAAI 2024)
Language:Python55 5 33
RS5M
RS5M: a large-scale vision language dataset for remote sensing [TGRS]
Language:Python281 10 2712
VL-CheckList
Evaluating Vision & Language Pretraining Models with Objects, Attributes and Relations. [EMNLP 2022]
Language:Python134 5 114
VLM-R1
Solve Visual Understanding with Reinforced VLMs
Language:Python5.5k 46 289351
ZoomEye
[EMNLP-2025 Oral] ZoomEye: Enhancing Multimodal LLMs with Human-Like Zooming Capabilities through Tree-Based Image Exploration
Language:Python53 2 73

Om AI Lab's Repositories

om-ai-lab/VLM-R1
Solve Visual Understanding with Reinforced VLMs
Language:Python5.5k 46 289351
om-ai-lab/OmAgent
Build multimodal language agents for fast prototype and production
Language:Python2.6k 132 31281
om-ai-lab/OmDet
Real-time and accurate open-vocabulary end-to-end object detection
Language:Python1.3k 68 24109
om-ai-lab/RS5M
RS5M: a large-scale vision language dataset for remote sensing [TGRS]
Language:Python281 10 2712
om-ai-lab/awesome-RSVLM
Collection of Remote Sensing Vision-Language Models
139 8 04
om-ai-lab/VL-CheckList
Evaluating Vision & Language Pretraining Models with Objects, Attributes and Relations. [EMNLP 2022]
Language:Python134 5 114
om-ai-lab/GroundVLP
GroundVLP: Harnessing Zero-shot Visual Grounding from Vision-Language Pre-training and Open-Vocabulary Object Detection (AAAI 2024)
Language:Jupyter Notebook71 4 45
om-ai-lab/OVDEval
A Comprehensive Evaluation Benchmark for Open-Vocabulary Detection (AAAI 2024)
Language:Python55 5 33
om-ai-lab/ZoomEye
[EMNLP-2025 Oral] ZoomEye: Enhancing Multimodal LLMs with Human-Like Zooming Capabilities through Tree-Based Image Exploration
Language:Python53 2 73
om-ai-lab/OmModel
A collection of strong multimodal models for building multimodal AGI agents
43 5 11
om-ai-lab/open-agent-leaderboard
Reproducible Language Agent Research
Language:Python29 5 12
om-ai-lab/ImageRAG
Enhancing Ultrahigh Resolution Remote Sensing Imagery Analysis With ImageRAG [GRSM]
Language:Jupyter Notebook18
om-ai-lab/OmChat
A suite of multimodal language models that are powerful and efficient
Language:Python17 2 03
om-ai-lab/OmAgentDocs
Language:HTML3 3 04
om-ai-lab/habitat-lab
A modular high-level library to train embodied AI agents across a variety of tasks, environments, and simulators.
Language:Python1 0 00
om-ai-lab/VLM-R1.github.io
Blog Site for VLM-R1
Language:HTML1
om-ai-lab/bottom-up-attention.pytorch
An PyTorch reimplementation of bottom-up-attention models
Language:Jupyter Notebook0 0 00
om-ai-lab/om-ai-lab.github.io
Official website for the org
Language:HTML1

Om AI Lab

Pinned Repositories

awesome-RSVLM

GroundVLP

OmAgent

OmDet

OmModel

OVDEval

RS5M

VL-CheckList

VLM-R1

ZoomEye

Om AI Lab's Repositories

om-ai-lab/VLM-R1

om-ai-lab/OmAgent

om-ai-lab/OmDet

om-ai-lab/RS5M

om-ai-lab/awesome-RSVLM

om-ai-lab/VL-CheckList

om-ai-lab/GroundVLP

om-ai-lab/OVDEval

om-ai-lab/ZoomEye

om-ai-lab/OmModel

om-ai-lab/open-agent-leaderboard

om-ai-lab/ImageRAG

om-ai-lab/OmChat

om-ai-lab/OmAgentDocs

om-ai-lab/habitat-lab

om-ai-lab/VLM-R1.github.io

om-ai-lab/bottom-up-attention.pytorch

om-ai-lab/om-ai-lab.github.io