Данные проекты были выполнены в ходе обучения в Сбер Университет, профессии "Специалист по Data Science".
Название проекта | Описание | Используемые библиотеки | Статус |
---|---|---|---|
Сжатие звука PCA | Предоставлена звуковая дорожка, нужно провести исследование её сжатия при помощи РСА | numpy, scipy, matplotlib, sklearn.decomposition.PCA | Завершён |
Netflix 1000 shows dataset EDA | Провести исследование датасета, сделать выводы о поведении пользователей, их оценках, проанализировать шоу по различным критериям | numpy, matplotlib, seaborn, pandas | Завершён |
Градиентный спуск и модели классического ML | Даны два датасета для задачи регрессии и классификации | numpy, scipy, pandas, phik, sklearn.metrics, sklearn.preprocessing, seaborn, matplotlib, LinearRegression, KNeighbors, LogisticRegression | Завершён |
House Prices prediction | Провести исследование датасета, сделать выводы о поведении пользователей, их оценках, проанализировать шоу по различным критериям | numpy, matplotlib, pandas, seaborn, phik, sklearn, preprocessing, StandardScaler, TargetEncoder, OneHotEncoder, LinearRegression, LogisticRegression, KNeighborsRegressor, SVR, RandomForestRegressor, GradientBoostingRegressor, DecisionTreeRegressor, CatBoostRegressor, lightgbm, Ridge, RidgeCV, Lasso, r2_score, mean_absolute_error, Blending | Завершён |
CV cifar10 | Создание и обучение сверточных сетей для распознавания изображений | numpy, torch, torchvision, cifar | Завершён |
CV U-net classification | Реализовать U-Net в файле model.py для задачи семантической сегментации: 0 - не автомобиль, 1 - автомобиль | numpy, torch, tensorboard, tqdm, SegmenterModel, carvana_dataset | Завершён |
NLP Seq2seq | Задача предсказания следующего токена по предыдущим, то есть задача языкового моделирования | numpy, torch, torchtext, vocab, counter, TransformerEncoder, PennTreebank, get_tokenizer | Завершён |