KeisukeImoto

Doshisha UniversityKyoto, Japan

KeisukeImoto's Stars

KeisukeImoto/RWCPSSD_Onomatopoeia
RWCP-SSD-Onomatopoeia
212
DCASE2023-Task7-Foley-Sound-Synthesis/dcase2023_task7_baseline
Language:Python327
sarulab-speech/visual-onoma-to-wave
Visual onoma-to-wave official implementation
Language:Python5
labmlai/annotated_deep_learning_paper_implementations
🧑‍🏫 60+ Implementations/tutorials of deep learning papers with side-by-side notes 📝; including transformers (original, xl, switch, feedback, vit, ...), optimizers (adam, adabelief, sophia, ...), gans(cyclegan, stylegan2, ...), 🎮 reinforcement learning (ppo, dqn), capsnet, distillation, ... 🧠
Language:Python54.1k5.6k
KeisukeImoto/mtl_sed_asc
Joint analysis of sound events and acoustic scenes based on multitask learning
Language:Python4
qiuqiangkong/audioset_tagging_cnn
Language:Python1.3k249
CrowdCurio/audio-annotator
A JavaScript interface for annotating and labeling audio files.
Language:JavaScript43384
an-tran528/wavetransformer
Code base for WaveTransformer: A novel architecture for automated audio captioning
Language:Python459
audio-captioning/audio-captioning-papers
A list of papers about audio captioning
778
audio-captioning/dcase-2020-baseline
Audio captioning baseline system for DCASE 2020 challenge.
Language:Python3711
toni-heittola/js-datatable
JQuery plugin to generate dynamic HTML tables with data visualization https://toni-heittola.github.io/js-datatable/
Language:JavaScript3819
karolpiczak/ESC-50
ESC-50: Dataset for Environmental Sound Classification
Language:Python1.4k286
DCASE-REPO/dcase_util
A collection of utilities for Detection and Classification of Acoustic Scenes and Events
Language:Python12733
espnet/espnet
End-to-End Speech Processing Toolkit
Language:Python8.3k2.2k

KeisukeImoto

KeisukeImoto's Stars

KeisukeImoto/RWCPSSD_Onomatopoeia

DCASE2023-Task7-Foley-Sound-Synthesis/dcase2023_task7_baseline

sarulab-speech/visual-onoma-to-wave

labmlai/annotated_deep_learning_paper_implementations

KeisukeImoto/mtl_sed_asc

qiuqiangkong/audioset_tagging_cnn

CrowdCurio/audio-annotator

an-tran528/wavetransformer

audio-captioning/audio-captioning-papers

audio-captioning/dcase-2020-baseline

toni-heittola/js-datatable

karolpiczak/ESC-50

DCASE-REPO/dcase_util

espnet/espnet