В репозитории представлены учебные проекты Яндекс.Практикум "Специалист по Data Science" по следующим темам:
№ | Проект | Jupyter Notebook | Описание | Инструменты |
---|---|---|---|---|
1 | Предобработка данных | notebook | Исследование статистики о платёжеспособности клиентов. Влияние семейного положения и количества детей клиента на факт возврата кредита в срок | - python - pandas - pymystem3 |
2 | Исследовательский анализ данных | notebook | Определение рыночной стоимости объектов недвижимости | - python - pandas - matplotlib |
3 | Статистический анализ данных | notebook | Анализ тарифов и их пользователей на выборке клиентов мобильного оператора | - python - pandas - scipy - math - matplotlib - seaborn - plotly |
4 | Сборный проект 1 "Предобработка данных" | notebook | Анализ исторических данных из открытых источников о продажах игр, оценках пользователей и экспертов, жанров и платформ | - python - pandas - scipy - math - matplotlib - seaborn - plotly |
5 | Базовое машинное обучение | notebook | Построение модели подбора мобильного тарифа для пользователя | - python - pandas - sklearn - matplotlib - seaborn |
6 | Обучение с учителем | notebook | Прогноз оттока клиентов банка на основании исторических данных | - python - pandas - sklearn - matplotlib - seaborn |
7 | Машинное обучение для бизнеса | notebook | В трёх нефтедобывающих регионах (по 10000 скважин в каждом) взяты пробы нефти, измерено качество сырья объём её запасов. Необходимо построить модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль | - python - pandas - numpy - sklearn - scipy - matplotlib - seaborn |
8 | Сборный проект 2 | notebook | Предсказание коэффициента восстановления золота из золотосодержащей руды. Доступны данные с параметрами добычи и очистки | - python - pandas - numpy - sklearn - scipy - matplotlib - seaborn |
9 | Численные методы | notebook flask-app |
Модель для определения стоимости автомобилей на основании технических характеристик, комплектаций и исторических данных | - python - pandas - sklearn - lightgbm - matplotlib - seaborn - flask |
10 | Временные ряды | notebook | Прогноз количества заказов такси на следующий час на основании исторической информации | - python - pandas - numpy - sklearn - statsmodels - matplotlib - seaborn |
11 | Классификация текстов | notebook | Классификация комментариев на позитивные и негативные. В распоряжении набор данных с разметкой о токсичности сообщений | - python - pandas - numpy - sklearn - nltk - matplotlib - seaborn |
12 | Предсказание оттока клиентов | notebook | Прогнозирование оттока клиентов мобильного оператора. Для выборки клиентов доступны персональные данные, информация о тарифах и договорах. | - python - pandas - numpy - sklearn - matplotlib - seaborn - catboost |