joanrod

PhD student at Mila, ÉTS and ServiceNow Research in Montreal, Canada. I work on AI and deep learning projects

ServiceNow ResearchMontreal

Pinned Repositories

awesome-tips
1 0 00
CLIP
Contrastive Language-Image Pretraining
Language:Jupyter Notebook0 0 00
CodeGen
CodeGen is an open-source model for program synthesis. Trained on TPU-v4. Competitive with OpenAI Codex.
Language:Python0 0 00
ControlNet
Let us control diffusion models!
Language:Python0 0 00
cross-modal-retrieval-with-triplet-network
Text-to-Image and Image-to-Text model retrieval
Language:Python0 0 00
figure-diffusion
Generating figures from research papers, using textual captions from the paper.
Language:Python23 2 43
galai
Model API for GALACTICA
Language:Python1 1 00
ocr-vqgan
OCR-VQGAN, a discrete image encoder (tokenizer and detokenizer) for figure images in Paper2Fig100k dataset. Implementation of OCR Perceptual loss for clear text-within-image generation. Fork from VQGAN in CompVis/taming-transformers
Language:Python75 2 121
paper2figure-dataset
Pipeline to create Paper2Fig dataset, a dataset for text-to-image generation from research papers and figures (e.g., diagrams of architectures or methods in fields like Machine Learning or Computer Vision)
Language:Python2 2 00
star-vector
114 42 41

joanrod's Repositories

joanrod/star-vector
114 42 41
joanrod/ocr-vqgan
OCR-VQGAN, a discrete image encoder (tokenizer and detokenizer) for figure images in Paper2Fig100k dataset. Implementation of OCR Perceptual loss for clear text-within-image generation. Fork from VQGAN in CompVis/taming-transformers
Language:Python75 2 121
joanrod/figure-diffusion
Generating figures from research papers, using textual captions from the paper.
Language:Python23 2 43
joanrod/paper2figure-dataset
Pipeline to create Paper2Fig dataset, a dataset for text-to-image generation from research papers and figures (e.g., diagrams of architectures or methods in fields like Machine Learning or Computer Vision)
Language:Python2 2 00
joanrod/awesome-tips
1 0 00
joanrod/galai
Model API for GALACTICA
Language:Python1 1 00
joanrod/CLIP
Contrastive Language-Image Pretraining
Language:Jupyter Notebook0 0 00
joanrod/CodeGen
CodeGen is an open-source model for program synthesis. Trained on TPU-v4. Competitive with OpenAI Codex.
Language:Python0 0 00
joanrod/ControlNet
Let us control diffusion models!
Language:Python0 0 00
joanrod/cross-modal-retrieval-with-triplet-network
Text-to-Image and Image-to-Text model retrieval
Language:Python0 0 00
joanrod/deforum-stable-diffusion
Language:Python0 0 00
joanrod/k-diffusion
Karras et al. (2022) diffusion models for PyTorch
Language:Python0 0 00
joanrod/M3-Project
Language:Jupyter Notebook0 1 00
joanrod/M5-Visual-Recognition
Language:Python0 0 00
joanrod/tracknet
TrackNet: A Triplet metric-based method for Multi-Target Multi-Camera Vehicle Tracking
Language:Python0 0 00
joanrod/UPF-Hand-Written-Text-Recognition
Language:Python0 0 00
joanrod/gigagan-pytorch
Implementation of GigaGAN, new SOTA GAN out of Adobe
Language:Python0 0
joanrod/joanrod
1 0
joanrod/joanrod.github.io
Language:HTML1 0
joanrod/LAVIS
LAVIS - A One-stop Library for Language-Vision Intelligence
Language:Python0 0
joanrod/Megatron-LM
Ongoing research training transformer models at scale
Language:Python0 0
joanrod/moviepy
Video editing with Python
joanrod/open_clip
An open source implementation of CLIP.
Language:Python0 0
joanrod/stablediffusion
High-Resolution Image Synthesis with Latent Diffusion Models
Language:Python0 0
joanrod/torch-fidelity
High-fidelity performance metrics for generative models in PyTorch
Language:Python0 0
joanrod/transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python0 0
joanrod/v-diffusion-pytorch
v objective diffusion inference code for PyTorch.
Language:Python0 0
joanrod/vdm
Language:Jupyter Notebook0 0