CrossmodalGroup

Beijing

Pinned Repositories

BFAN
Implementation of our ACMMM2019 paper, Focus Your Attention: A Bidirectional Focal Attention Network for Image-Text Matching
Language:Python37 2 22
CMCAN
Implementation of our AAAI2022 paper, Show Your Faith: Cross-Modal Confidence-Aware Network for Image-Text Matching.
Language:Python36 2 104
DynamicVectorQuantization
Official Pytorch Implementation of Our CVPR2023 Paper: "Towards Accurate Image Coding: Improved Autoregressive Image Generation with Dynamic Vector Quantization"
Language:Python166 4 96
ER-SAN
Implementation of our IJCAI2022 oral paper, ER-SAN: Enhanced-Adaptive Relation Self-Attention Network for Image Captioning.
Language:Python22 2 23
GSMN
Implementation of our CVPR2020 paper, Graph Structured Network for Image-Text Matching
Language:Python164 7 2630
HREM
Learning Semantic Relationship among Instances for Image-Text Matching, CVPR, 2023
Language:Python85 4 158
LAPS
Linguistic-Aware Patch Slimming Framework for Fine-grained Cross-Modal Alignment, CVPR, 2024
Language:Python80 7 78
MaskedVectorQuantization
Official Pytorch Implementation of Our CVPR2023 Paper: "Not All Image Regions Matter: Masked Vector Quantization for Autoregressive Image Generation"
Language:Python57 2 53
NAAF
Implementation of our CVPR2022 paper, Negative-Aware Attention Framework for Image-Text Matching.
Language:Python111 3 1911
SSL-VQA
Code for our IJCAI2020 paper: Overcoming Language Priors with Self-supervised Learning for Visual Question Answering
Language:Python49 1 611

CrossmodalGroup's Repositories

CrossmodalGroup/DynamicVectorQuantization
Official Pytorch Implementation of Our CVPR2023 Paper: "Towards Accurate Image Coding: Improved Autoregressive Image Generation with Dynamic Vector Quantization"
Language:Python166 4 96
CrossmodalGroup/GSMN
Implementation of our CVPR2020 paper, Graph Structured Network for Image-Text Matching
Language:Python164 7 2630
CrossmodalGroup/NAAF
Implementation of our CVPR2022 paper, Negative-Aware Attention Framework for Image-Text Matching.
Language:Python111 3 1911
CrossmodalGroup/HREM
Learning Semantic Relationship among Instances for Image-Text Matching, CVPR, 2023
Language:Python85 4 158
CrossmodalGroup/LAPS
Linguistic-Aware Patch Slimming Framework for Fine-grained Cross-Modal Alignment, CVPR, 2024
Language:Python80 7 78
CrossmodalGroup/MaskedVectorQuantization
Official Pytorch Implementation of Our CVPR2023 Paper: "Not All Image Regions Matter: Masked Vector Quantization for Autoregressive Image Generation"
Language:Python57 2 53
CrossmodalGroup/SSL-VQA
Code for our IJCAI2020 paper: Overcoming Language Priors with Self-supervised Learning for Visual Question Answering
Language:Python49 1 611
CrossmodalGroup/BFAN
Implementation of our ACMMM2019 paper, Focus Your Attention: A Bidirectional Focal Attention Network for Image-Text Matching
Language:Python37 2 22
CrossmodalGroup/CMCAN
Implementation of our AAAI2022 paper, Show Your Faith: Cross-Modal Confidence-Aware Network for Image-Text Matching.
Language:Python36 2 104
CrossmodalGroup/ER-SAN
Implementation of our IJCAI2022 oral paper, ER-SAN: Enhanced-Adaptive Relation Self-Attention Network for Image Captioning.
Language:Python22 2 23
CrossmodalGroup/ESL
Language:Python13 1 12
CrossmodalGroup/CSA-Net
Language:Python9 1 11
CrossmodalGroup/X-Dim
Language:Python7 1 11
CrossmodalGroup/ChineseAlpacaEval
Language:Python1
CrossmodalGroup/KNN-Instruct
[EMNLP 2024] KNN-Instruct: Automatic Instruction Construction with K Nearest Neighbor Deduction
Language:Python1 1 0

CrossmodalGroup

Pinned Repositories

BFAN

CMCAN

DynamicVectorQuantization

ER-SAN

GSMN

HREM

LAPS

MaskedVectorQuantization

NAAF

SSL-VQA

CrossmodalGroup's Repositories

CrossmodalGroup/DynamicVectorQuantization

CrossmodalGroup/GSMN

CrossmodalGroup/NAAF

CrossmodalGroup/HREM

CrossmodalGroup/LAPS

CrossmodalGroup/MaskedVectorQuantization

CrossmodalGroup/SSL-VQA

CrossmodalGroup/BFAN

CrossmodalGroup/CMCAN

CrossmodalGroup/ER-SAN

CrossmodalGroup/ESL

CrossmodalGroup/CSA-Net

CrossmodalGroup/X-Dim

CrossmodalGroup/ChineseAlpacaEval

CrossmodalGroup/KNN-Instruct