Этот репозиторий содержит выполненные проекты во время обучения в Яндекс Практикуме по направлению "Специалист по Data Science"
Оператор связи хочет научиться прогнозировать отток клиентов.
- Чтение и работа с датасетами: Pandas и Numpy
- Визуализации анализа данных: Seaborn и Matplotlib
- Визуализация тренда и сезонности данных: Pylab и Statsmodels
- Для решения задачи прогнозирования: линейная регрессия из библиотеки Sklearn и градиентные бустинги из библиотек CatBoost, LightGBM
Компания такси собрала исторические данные о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час.
- Чтение и работа с датасетами: Pandas и Numpy
- Визуализации анализа данных: Seaborn и Matplotlib
- Визуализация тренда и сезонности данных: Pylab и Statsmodels
- Для решения задачи прогнозирования: линейная регрессия из библиотеки Sklearn и градиентные бустинги из библиотек CatBoost, LightGBM
Компания "Цифры" разрабатывает решения для эффективной работы промышленных предприятий.Необходимо построить модель предсказания коэффициента восстановления золота из золотосодержащей руды. В вашем распоряжении данные с параметрами добычи и очистки. Модель поможет оптимизировать производство, чтобы не запускать предприятие с убыточными характеристиками.
- Чтение и работа с датасетами: Pandas и Numpy
- Визуализация данных: Matplotlib
- Для решения задачи прогнозирования: LinearRegression и DecisionTreeRegressor из библиотеки Sklearn и градиентный бустинг из библиотеки CatBoost
Интернет-магазин продаёт по всему миру компьютерные игры. Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы (например, Xbox или PlayStation). Нужно выявить определяющие успешность игры закономерности. Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании.
- Чтение и работа с датасетами: Pandas и Numpy
- Визуализации анализа данных: Seaborn и Matplotlib
- Статистический анализ: Scipy
Сервис по продаже автомобилей с пробегом разрабатывает приложение, чтобы привлечь новых клиентов. В нём можно будет узнать рыночную стоимость своего автомобиля.
- Чтение и работа с датасетами: Pandas и Numpy
- Предобработка данных: Sklearn
- Для решения задачи прогнозирования: линейная регрессия и градиентый бустинг из библиотеки Sklearn и градиентные бустинги из библиотек CatBoost, LightGBM