Проекты были написаны при обучении на специалиста по "Data Science".
Всего было выполнено 14 проектов, но показано 12 проектов.
В проектах использовались различные методы: предобработка, анализ данных, проверка гипотез, подготовка признаков для обучения моделей, обучение моделей.
Библиотеки использовавшиеся в проектах: pandas, numpy, matplotlib.pyplot, seaborn, scipy, sklearn, stats, catboost, lightgbm, tensorflow, keras, nltk
Название проекта | Задача | Используемые библиотеки |
---|---|---|
01. Исследование платежеспособности заемщиков | Выявить, какие факторы влияют на возврат кредита в срок | Pandas, Mystem |
02. Исследование объявлений о продаже квартир | Используя данные определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Pandas, Matplotlib.pyplot |
03. Определение перспективного тарифа для телеком компании | Проанализировать два тарифных плана компании «Мегалайн»: «Смарт» и «Ультра». Необходимо дать ответ, какой тариф более прибыльный | Pandas, Numpy, Seaborn, Matplotlib.pyplot, Scipy |
04. Сборный проект первого модуля | Выявить определяющие успешность игры закономерности | Pandas, Numpy, Seaborn, Matplotlib.pyplot, Scipy |
05. Прогнозирование оттока клиентов | На основе исторических данных спрогнозировать, уйдёт клиент из банка в ближайшее время или нет | Pandas, Numpy, Seaborn, Matplotlib.pyplot, Sklearn |
06. Предсказание коэффициента востановления золота | Подготовить прототип модели машинного для оптимизации производства | Pandas, Numpy, Seaborn, Matplotlib.pyplot, Scipy |
07. Защита персональных данных клиентов | Разработка метода преобразования данных, чтобы по ним было сложно восстановить персональную информацию. | Pandas, Numpy, Matplotlib.pyplot, Sklearn, Seaborn |
08. Прогнозирование заказов такси | Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час | Pandas, Numpy, Matplotlib.pyplot, Statsmodels, Lightgbm |
09. Машинное обучение для текстов | Обучите модель классифицировать комментарии на позитивные и негативные | Pandas, Numpy, Matplotlib.pyplot, Statsmodels, Lightgbm, Re, Transformers, Nltk, Seaborn |
10. SQL запросы и анализ | Изучить базу данных, аписать запросы для выгрузки данных, и проанализировать спрос пассажиров на рейсы в города, где проходят крупнейшие культурные фестивали | Pandas, Numpy, Matplotlib.pyplot, Seaborn |
11. Определение возраста по фотографии | Построить модель, которая по фотографии определит приблизительный возраст человека | Pandas, Numpy, Matplotlib.pyplot, Tensorflow, Keras |
12. Определение температуры для выплавки стали (Финальный проект) | Построить модель, которая по данным будет предсказывать температуру | Pandas, Numpy, Matplotlib.pyplot, Seaborn, Catboost, Lightgbm |