linjieli222

University of Washington; MicrosoftSeattle, WA

Pinned Repositories

UNITER
Research code for ECCV 2020 paper "UNITER: UNiversal Image-TExt Representation Learning"
Language:Python765 18 94108
ClipBERT
[CVPR 2021 Best Student Paper Honorable Mention, Oral] Official PyTorch code for ClipBERT, an efficient framework for end-to-end learning on image-text and video-text tasks.
Language:Python689 9 5885
attrEXP
attractiveness experiments on Amazon MTurk
Language:JavaScript0 2 00
HERO
Research code for EMNLP 2020 paper "HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training"
Language:Python228 7 4635
HERO_Video_Feature_Extractor
Video Feature Extraction Code for EMNLP 2020 paper "HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training"
Language:Python91 3 814
VALUE
Video And Language Understanding Evaluation
Language:Python2 3 00
VQA_ReGAT
Research Code for ICCV 2019 paper "Relation-aware Graph Attention Network for Visual Question Answering"
Language:Python176 6 4138
MM-REACT
Official repo for MM-REACT
Language:Python909 19 1068
Segment-Everything-Everywhere-All-At-Once
[NeurIPS 2023] Official implementation of the paper "Segment Everything Everywhere All at Once"
Language:Python4.1k 55 133329
VILLA
Research Code for NeurIPS 2020 Spotlight paper "Large-Scale Adversarial Training for Vision-and-Language Representation Learning": UNITER adversarial training part
Language:Python118 8 1212

linjieli222's Repositories

linjieli222/HERO
Research code for EMNLP 2020 paper "HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training"
Language:Python228 7 4635
linjieli222/VQA_ReGAT
Research Code for ICCV 2019 paper "Relation-aware Graph Attention Network for Visual Question Answering"
Language:Python176 6 4138
linjieli222/HERO_Video_Feature_Extractor
Video Feature Extraction Code for EMNLP 2020 paper "HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training"
Language:Python91 3 814
linjieli222/VALUE
Video And Language Understanding Evaluation
Language:Python2 3 00
linjieli222/attrEXP
attractiveness experiments on Amazon MTurk
Language:JavaScript0 2 00
linjieli222/bottom-up-attention
Bottom-up attention model for image captioning and VQA, based on Faster R-CNN and Visual Genome
Language:Jupyter Notebook0 1 00
linjieli222/cc
Creative Commons copyright license files
Language:HTML0 0
linjieli222/diffusers
🤗 Diffusers: State-of-the-art diffusion models for image and audio generation in PyTorch
Language:Python0 0
linjieli222/merlot-1
MERLOT: Multimodal Neural Script Knowledge Models
Language:Python0 0
linjieli222/MIL-NCE_HowTo100M
PyTorch GPU distributed training code for MIL-NCE HowTo100M
Language:Python0 0
linjieli222/pythia
A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)
Language:Python1 0
linjieli222/seada-vqa
A pytorch implemetation of data augmentation method for visual question answering
linjieli222/simi_pair
Language:Matlab4 0
linjieli222/SlowFast
PySlowFast: video understanding codebase from FAIR for reproducing state-of-the-art video models.
Language:Python1 0
linjieli222/TVRetrieval
PyTorch implementation of XML on TVR dataset - TVR: A Large-Scale Dataset for Video-Subtitle Moment Retrieval
Language:Python1 0
linjieli222/vqa2vln-tutorial.github.io
linjieli222/X-Decoder
[CVPR 2023] Official Implementation of X-Decoder for generalized decoding for pixel, image and language
Language:Python0 0

linjieli222

Pinned Repositories

UNITER

ClipBERT

attrEXP

HERO

HERO_Video_Feature_Extractor

VALUE

VQA_ReGAT

MM-REACT

Segment-Everything-Everywhere-All-At-Once

VILLA

linjieli222's Repositories

linjieli222/HERO

linjieli222/VQA_ReGAT

linjieli222/HERO_Video_Feature_Extractor

linjieli222/VALUE

linjieli222/attrEXP

linjieli222/bottom-up-attention

linjieli222/cc

linjieli222/diffusers

linjieli222/merlot-1

linjieli222/MIL-NCE_HowTo100M

linjieli222/pythia

linjieli222/seada-vqa

linjieli222/simi_pair

linjieli222/SlowFast

linjieli222/TVRetrieval

linjieli222/vqa2vln-tutorial.github.io

linjieli222/X-Decoder