terry-r123

USYD & Shanghai AI Lab

terry-r123's Stars

terry-r123/Awesome-Captioning
A curated list of Multimodal Captioning related research(including image captioning, video captioning, and text captioning)
10710
sokrypton/ColabFold
Making Protein folding accessible to all!
Language:Jupyter Notebook1.9k482
deepmodeling/Uni-Fold
Language:Python9118
FangShancheng/ABINet
Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognition
Language:Jupyter Notebook42872
Hangz-nju-cuhk/Talking-Face_PC-AVS
Code for Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual Representation (CVPR 2021)
Language:Python922169
facebookresearch/mmf
A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)
Language:Python5.5k935
aimagelab/meshed-memory-transformer
Meshed-Memory Transformer for Image Captioning. CVPR 2020
Language:Python518136
facebookresearch/grid-feats-vqa
Grid features pre-training code for visual question answering
Language:Python26846
albanie/collaborative-experts
Video embeddings for retrieval with natural language queries
Language:Python33555
microsoft/Oscar
Oscar and VinVL
Language:Python1k251
DTaoo/Discriminative-Sounding-Objects-Localization
Code for Discriminative Sounding Objects Localization (NeurIPS 2020)
Language:Python579
karpathy/neuraltalk2
Efficient Image Captioning code in Torch, runs on GPU
Language:Jupyter Notebook5.5k1.3k
karpathy/neuraltalk
NeuralTalk is a Python+numpy project for learning Multimodal Recurrent Neural Networks that describe images with sentences.
Language:Python5.4k1.3k
krantiparida/awesome-audio-visual
A curated list of different papers and datasets in various areas of audio-visual processing
66270
LividWo/Revisit-MMT
Language:Python224
fortunechen/Awesome-Visual-Captioning
This repository focus on Image Captioning & Video Captioning & Seq-to-Seq Learning & NLP
21
ruotianluo/self-critical.pytorch
Unofficial pytorch implementation for Self-critical Sequence Training for Image Captioning. and others.
Language:Python995278
twairball/fairseq-zh-en
NMT for chinese-english using fairseq
Language:Jupyter Notebook21049
NeuronDance/DeepRL
Deep Reinforcement Learning Lab, a platform designed to make DRL technology and fun for everyone
2.4k578

terry-r123

terry-r123's Stars

terry-r123/Awesome-Captioning

sokrypton/ColabFold

deepmodeling/Uni-Fold

FangShancheng/ABINet

Hangz-nju-cuhk/Talking-Face_PC-AVS

facebookresearch/mmf

aimagelab/meshed-memory-transformer

facebookresearch/grid-feats-vqa

albanie/collaborative-experts

microsoft/Oscar

DTaoo/Discriminative-Sounding-Objects-Localization

karpathy/neuraltalk2

karpathy/neuraltalk

krantiparida/awesome-audio-visual

LividWo/Revisit-MMT

fortunechen/Awesome-Visual-Captioning

ruotianluo/self-critical.pytorch

twairball/fairseq-zh-en

NeuronDance/DeepRL