Pinned Repositories
DiffuSeq
[ICLR'23] DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models
document-extractor
Extract part from document that corresponds to the specified label
Fake-News-Classification
fake news classification using MLP, LSTM and transformer
lanit-summer2022-face_antispoofing
face anti-spoofing using different algorithms
lanit-summer2022-traffic
comparing different neural algorithms for restoring images
smart-product
Predict category of product by it's description, image and other attributes
time-stretch
implement time stretching algorithm for audio without pitch shifting
wave_tool
Консольное приложение для работы с WAV аудиофайлами, позволяющее изменять скорость и громкость воспроизведения, а также осуществлять расшифровку речи в текст с помощью модели Whisper, поддерживая распознавания на разных языках
funny-and-tochka
Jokes generation using neural networks wrapped in web application with FastAPI
spectrogram-soul
speech emotion recognition using Audio Spectrogram Transformer on resd dataset
Abletobetable's Repositories
Abletobetable/rails-champ
Цифровой прорыв - чемпионат Новосибирской области - классификация объектов железной дороги
Abletobetable/smart-product
Predict category of product by it's description, image and other attributes
Abletobetable/DiffuSeq
[ICLR'23] DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models
Abletobetable/document-extractor
Extract part from document that corresponds to the specified label
Abletobetable/Fake-News-Classification
fake news classification using MLP, LSTM and transformer
Abletobetable/lanit-summer2022-face_antispoofing
face anti-spoofing using different algorithms
Abletobetable/lanit-summer2022-traffic
comparing different neural algorithms for restoring images
Abletobetable/MVSS-report
Report on "Image Manipulation Detection by Multi-View Multi-Scale Supervision"
Abletobetable/time-stretch
implement time stretching algorithm for audio without pitch shifting
Abletobetable/wave_tool
Консольное приложение для работы с WAV аудиофайлами, позволяющее изменять скорость и громкость воспроизведения, а также осуществлять расшифровку речи в текст с помощью модели Whisper, поддерживая распознавания на разных языках