/Portfolio

Учебные проекты из Яндекс Практикума "Специалист по Data Science+"

Primary LanguageJupyter Notebook

Портфолио учебных проектов программы Data Science+ на платформе Яндекс.Практикум

Здесь представлены проекты, выполненные мною во время учебы в Яндекс Практикуме по специальности "Специалист по Data Science расширенный".

Название проекта Описание Инструменты
1 Оценка музыкальных предпочтений Исследование поведения и музыкальных предпочтений пользователей Москвы и Санкт-Петербурга pandas
2 Исследование надежности заемщиков Оценка влияния семейного положения клиентов банка на своевременное погашение кредита pandas
3 Исследование рынка недвижимости Исследование параметров, влияющих на рыночную стоимость объектов недвижимости pandas, matplotlib, numpy
4 Исследование рынка российского кинопроката Изучение особенностей рынка российского кинопроката pandas, matplotlib, numpy
5 Статистический анализ данных сервиса аренды самокатов Анализ поведения пользователей сервиса аренды самокатов, проверка статистических гипотез pandas, matplotlib, numpy, scipy, math
6 Рекомендация тарифов Создание модели, предлагающей клиенту наиболее оптимальный мобильный тариф pandas, sklearn
7 Прогнозирование оттока клиентов Построение модели, прогнозирующей, покинет ли клиент банк в ближайшее время pandas, sklearn, numpy, matplotlib
8 Оценка объемов нефтедобычи Построение модели определяющей наиболее выгодный регион для разработки новых нефтяных скважин pandas, sklearn, numpy, matplotlib
9 Прогнозирование отмены бронирования Проектирование модели для предсказания отмены бронирования pandas, sklearn, numpy, matplotlib, seaborn
10 Music genre prediction M1_26DS+ Разработатка модели классификации музыкальных произведений по жанрам pandas, sklearn, numpy, matplotlib, scipy, phik, xgboost, catboost
11 Предсказание стоимости жилья Обучение модели, определяющей медианную стоимость квартиры в жилом массиве pandas, pyspark, numpy, matplotlib
12 Защита персональных данных клиентов Разработка надежного метода шифрования персональных данных, не влияющего на качество предсказаний модели pandas, sklearn, numpy, matplotlib, seaborn, phik
13 Определение стоимости автомобилей Построение модели, оперативно предсказывающей рыночную стоимость автомобиля pandas, numpy, seaborn, matplotlib, phik, time, sklearn, lightgbm, catboost
14 Приближенный поиск ближайших соседей Создание ранжирующей модели, которая среди миллионов товаров ищет пять, наиболее подходящих по запросу. pandas, sklearn, numpy, matplotlib, scipy, seaborn, faiss
15 Прогнозирование температуры поверхности звезды Построение нейросети, максимально точно определяющей абсолютную температуру на поверхности звёзды torch, pandas, numpy, math, seaborn, matplotlib, phik, time, sklearn
16 Оценка рисков ДТП Создание адекватной системы оценки водительского риска на каршеринге torch, pandas, numpy, math, seaborn, matplotlib, phik, sqlalchemy, sklearn, catboost
17 Прогнозирование заказов такси Создание модели, предсказывающей количество заказов такси на следующий час pandas, numpy, seaborn, matplotlib, statsmodels, sklearn, catboost, lightgbm
18 Определение токсичности комментариев Подготовка модели, классифицирующей комментарии на нейтральные и токсичные для последующей модерации pandas, numpy, matplotlib, torch, re, nltk, chardet, transformers, tqdm, imblearn, wordcloud, sklearn, catboost
19 Определение возраста покупателей по фотографии Построение модели, визуально определяющей возраст человека в супермаркете по фото pandas, tensorflow.keras, matplotlib, seaborn, numpy
20 Поиск по изображению Разработка демонстрационной версии поиска изображений по запросу pandas, sklearn, nltk, re, BERT, CLIP, torch, transformers, sentence_transformers, matplotlib, seaborn, PIL, numpy, math, os
21 Предсказание оттока абонентов Создание модели, прогнозирующей отток абонентов из телекоммуникационной компании pandas, phik, sqlalchemy, matplotlib, seaborn, numpy, sklearn, pipeline, columntransformer, catboost, lightgbm