Здесь представлены проекты, выполненные мною во время учебы в Яндекс Практикуме по специальности "Специалист по Data Science расширенный".
№ | Название проекта | Описание | Инструменты |
---|---|---|---|
1 | Оценка музыкальных предпочтений | Исследование поведения и музыкальных предпочтений пользователей Москвы и Санкт-Петербурга | pandas |
2 | Исследование надежности заемщиков | Оценка влияния семейного положения клиентов банка на своевременное погашение кредита | pandas |
3 | Исследование рынка недвижимости | Исследование параметров, влияющих на рыночную стоимость объектов недвижимости | pandas, matplotlib, numpy |
4 | Исследование рынка российского кинопроката | Изучение особенностей рынка российского кинопроката | pandas, matplotlib, numpy |
5 | Статистический анализ данных сервиса аренды самокатов | Анализ поведения пользователей сервиса аренды самокатов, проверка статистических гипотез | pandas, matplotlib, numpy, scipy, math |
6 | Рекомендация тарифов | Создание модели, предлагающей клиенту наиболее оптимальный мобильный тариф | pandas, sklearn |
7 | Прогнозирование оттока клиентов | Построение модели, прогнозирующей, покинет ли клиент банк в ближайшее время | pandas, sklearn, numpy, matplotlib |
8 | Оценка объемов нефтедобычи | Построение модели определяющей наиболее выгодный регион для разработки новых нефтяных скважин | pandas, sklearn, numpy, matplotlib |
9 | Прогнозирование отмены бронирования | Проектирование модели для предсказания отмены бронирования | pandas, sklearn, numpy, matplotlib, seaborn |
10 | Music genre prediction M1_26DS+ | Разработатка модели классификации музыкальных произведений по жанрам | pandas, sklearn, numpy, matplotlib, scipy, phik, xgboost, catboost |
11 | Предсказание стоимости жилья | Обучение модели, определяющей медианную стоимость квартиры в жилом массиве | pandas, pyspark, numpy, matplotlib |
12 | Защита персональных данных клиентов | Разработка надежного метода шифрования персональных данных, не влияющего на качество предсказаний модели | pandas, sklearn, numpy, matplotlib, seaborn, phik |
13 | Определение стоимости автомобилей | Построение модели, оперативно предсказывающей рыночную стоимость автомобиля | pandas, numpy, seaborn, matplotlib, phik, time, sklearn, lightgbm, catboost |
14 | Приближенный поиск ближайших соседей | Создание ранжирующей модели, которая среди миллионов товаров ищет пять, наиболее подходящих по запросу. | pandas, sklearn, numpy, matplotlib, scipy, seaborn, faiss |
15 | Прогнозирование температуры поверхности звезды | Построение нейросети, максимально точно определяющей абсолютную температуру на поверхности звёзды | torch, pandas, numpy, math, seaborn, matplotlib, phik, time, sklearn |
16 | Оценка рисков ДТП | Создание адекватной системы оценки водительского риска на каршеринге | torch, pandas, numpy, math, seaborn, matplotlib, phik, sqlalchemy, sklearn, catboost |
17 | Прогнозирование заказов такси | Создание модели, предсказывающей количество заказов такси на следующий час | pandas, numpy, seaborn, matplotlib, statsmodels, sklearn, catboost, lightgbm |
18 | Определение токсичности комментариев | Подготовка модели, классифицирующей комментарии на нейтральные и токсичные для последующей модерации | pandas, numpy, matplotlib, torch, re, nltk, chardet, transformers, tqdm, imblearn, wordcloud, sklearn, catboost |
19 | Определение возраста покупателей по фотографии | Построение модели, визуально определяющей возраст человека в супермаркете по фото | pandas, tensorflow.keras, matplotlib, seaborn, numpy |
20 | Поиск по изображению | Разработка демонстрационной версии поиска изображений по запросу | pandas, sklearn, nltk, re, BERT, CLIP, torch, transformers, sentence_transformers, matplotlib, seaborn, PIL, numpy, math, os |
21 | Предсказание оттока абонентов | Создание модели, прогнозирующей отток абонентов из телекоммуникационной компании | pandas, phik, sqlalchemy, matplotlib, seaborn, numpy, sklearn, pipeline, columntransformer, catboost, lightgbm |