david-gimeno

I am PhD student in Computer Science at Universitat Politècnica de València. My interests are Speech Technologies, Computer Vision, and Affective Computing.

Pattern Recognition and Human Languages Technology, Research CenterValencia, Spain

Pinned Repositories

multimodal-depression-from-video
Official source code for the paper: "Reading Between the Frames Multi-Modal Non-Verbal Depression Detection in Videos"
Language:Python27 3 272
Evaluation_of_End-to-End_Continuous_Spanish_Lipreading_in_Different_Data_Conditions
Visual Speech Recognition for Spanish
Language:Python10
LIP-RTVE
An Audiovisual Database for Continuous Spanish in the Wild
Language:Python6 1 01
lipreading-thesis
Official source code developed for my Ph.D Thesis Dissertation: "Contributions to Automatic Lipreading for Spanish"
Language:Python20
tailored-avsr
Official source code for the paper "Tailored Design of Audio-Visual Speech Recognition Models using Branchformers"
Language:Python20
espnet
End-to-End Speech Processing Toolkit
Language:Python8.1k 177 2.3k2.1k
av_hubert
A self-supervised learning framework for audio-visual speech
Language:Python805 17 107128
AnnoTheia
AnnoTheia is a data annotation toolkit that identifies when a person speaks in a scene and transcribes their speech, also offering flexibility to replace modules for different languages.
Language:Python24 1 10
captum
Model interpretability and understanding for PyTorch
Language:Python4.7k 251 528476
Fotoapparat
Making Camera for Android more friendly. 📸
Language:Kotlin3.8k 92 339405

david-gimeno's Repositories

david-gimeno/LIP-RTVE
An Audiovisual Database for Continuous Spanish in the Wild
Language:Python6 1 01
david-gimeno/lipreading-thesis
Official source code developed for my Ph.D Thesis Dissertation: "Contributions to Automatic Lipreading for Spanish"
Language:Python20
david-gimeno/tailored-avsr
Official source code for the paper "Tailored Design of Audio-Visual Speech Recognition Models using Branchformers"
Language:Python20
david-gimeno/Evaluation_of_End-to-End_Continuous_Spanish_Lipreading_in_Different_Data_Conditions
Visual Speech Recognition for Spanish
Language:Python10

david-gimeno

Pinned Repositories

multimodal-depression-from-video

Evaluation_of_End-to-End_Continuous_Spanish_Lipreading_in_Different_Data_Conditions

LIP-RTVE

lipreading-thesis

tailored-avsr

espnet

av_hubert

AnnoTheia

captum

Fotoapparat

david-gimeno's Repositories

david-gimeno/LIP-RTVE

david-gimeno/lipreading-thesis

david-gimeno/tailored-avsr

david-gimeno/Evaluation_of_End-to-End_Continuous_Spanish_Lipreading_in_Different_Data_Conditions