/ya_practicum_ds

Primary LanguageJupyter Notebook

Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме по направлению "Специалист по Data Science".

Название проекта Описание Используемые библиотеки
Исследование надёжности заёмщиков Определение влияния семейного положения и количества детей клиента на факт погашения кредита в срок для дальнейшей разработки специальной системы, оценивающей способность потенциального заёмщика вернуть кредит банку pandas, numpy, pymystem3
Исследование объявлений о продаже квартир Определение рыночной стоимости объектов недвижимости. Обнаружение параметров, позволяющих построить автоматизированную систему, способную отслеживать аномалии и мошенническую деятельность pandas, plotly
Определение перспективного тарифа для телеком компании Исследование поведения клиентов для определения наиболее перпективного тарифа pandas, numpy, plotly, scipy
Исследование исторических данных о продажах игр Выявление закономерностей, определяющих успешность игры. С дальнейшей целью сделать ставку на потенциально популярный продукт и спланировать рекламные кампании pandas, numpy, plotly, random, matplotlib, seaborn, scipy
Рекомендация тарифов для пользователей Построение моделей для предсказания наиболее подходящего тарифа pandas, sklearn, plotly
Прогнозирование оттока клиентов банка Прогнозирование ухода клиента из банка в ближайшее время, построение модель с предельно большим значением F1-меры pandas, sklearn, numpy, matplotlib, plotly
Анализ рисков и прибыли нефтедобывающей компании Анализ возможной прибыли и рисков для нефтедобывающей компании. На основе данных о трех регионах по 10 000 месторождений в каждом, об измерении качества нефти и объема ее запасов будет принято решение о бурении новых скважин pandas, sklearn, numpy, matplotlib, plotly
Прототип модели предсказывающей коэффициент восстановления золота из золотосодержащей руды Разработка прототипа модели машинного обучения, способной предсказывать коэффициент восстановления золота из золотосодержащей руды pandas, sklearn, numpy, matplotlib, plotly
Защита персональных данных клиентов банка Разработка метода шифрования персональных данных с сохранение возможности делать предсказания без потери точности pandas, sklearn, numpy
Определение стоимости автомобилей Построение моделей для определения стоимости автомобиля для сервиса продажи машин pandas, sklearn, numpy, plotly, matplotlib, lightgbm, catboost
Прогнозирование заказов такси Обучение модели для предсказания количества заказов такси на следующий час pandas, numpy, matplotlib, sklearn, statsmodels, CatBoost, LightGBM
Разработка инструмента для поиска токсичных комментариев в интернет-магазине Обучение модели классифицировать комментарии на позитивные и негативные pandas, numpy, matplotlib, NLTK, sklearn, lightgbm
Определение возраста покупателей сетевого супермаркета Построение модели, которая по фотографии определит приблизительный возраст человека с целью дальнейшего анализа покупок и предложения товаров, которые могут заинтересовать покупателей определённой возрастной группы pandas, numpy, matplotlib, keras, компьютерное зрение, машинное обучение
Предсказание температуры стали для металлургического комбината Построение модели для предсказания температуры стали. Полученное предсказание планируется использовать в дальнейшем для уменьшения потребления электроэнергии на этапе обработки стали, с целью оптимизации производственных расходов на металлургическом комбинате. pandas, sklearn, numpy, plotly, matplotlib, lightgbm, catboost