Исследование надёжности заёмщиков |
Определение влияния семейного положения и количества детей клиента на факт погашения кредита в срок для дальнейшей разработки специальной системы, оценивающей способность потенциального заёмщика вернуть кредит банку |
pandas, numpy, pymystem3 |
Исследование объявлений о продаже квартир |
Определение рыночной стоимости объектов недвижимости. Обнаружение параметров, позволяющих построить автоматизированную систему, способную отслеживать аномалии и мошенническую деятельность |
pandas, plotly |
Определение перспективного тарифа для телеком компании |
Исследование поведения клиентов для определения наиболее перпективного тарифа |
pandas, numpy, plotly, scipy |
Исследование исторических данных о продажах игр |
Выявление закономерностей, определяющих успешность игры. С дальнейшей целью сделать ставку на потенциально популярный продукт и спланировать рекламные кампании |
pandas, numpy, plotly, random, matplotlib, seaborn, scipy |
Рекомендация тарифов для пользователей |
Построение моделей для предсказания наиболее подходящего тарифа |
pandas, sklearn, plotly |
Прогнозирование оттока клиентов банка |
Прогнозирование ухода клиента из банка в ближайшее время, построение модель с предельно большим значением F1-меры |
pandas, sklearn, numpy, matplotlib, plotly |
Анализ рисков и прибыли нефтедобывающей компании |
Анализ возможной прибыли и рисков для нефтедобывающей компании. На основе данных о трех регионах по 10 000 месторождений в каждом, об измерении качества нефти и объема ее запасов будет принято решение о бурении новых скважин |
pandas, sklearn, numpy, matplotlib, plotly |
Прототип модели предсказывающей коэффициент восстановления золота из золотосодержащей руды |
Разработка прототипа модели машинного обучения, способной предсказывать коэффициент восстановления золота из золотосодержащей руды |
pandas, sklearn, numpy, matplotlib, plotly |
Защита персональных данных клиентов банка |
Разработка метода шифрования персональных данных с сохранение возможности делать предсказания без потери точности |
pandas, sklearn, numpy |
Определение стоимости автомобилей |
Построение моделей для определения стоимости автомобиля для сервиса продажи машин |
pandas, sklearn, numpy, plotly, matplotlib, lightgbm, catboost |
Прогнозирование заказов такси |
Обучение модели для предсказания количества заказов такси на следующий час |
pandas, numpy, matplotlib, sklearn, statsmodels, CatBoost, LightGBM |
Разработка инструмента для поиска токсичных комментариев в интернет-магазине |
Обучение модели классифицировать комментарии на позитивные и негативные |
pandas, numpy, matplotlib, NLTK, sklearn, lightgbm |
Определение возраста покупателей сетевого супермаркета |
Построение модели, которая по фотографии определит приблизительный возраст человека с целью дальнейшего анализа покупок и предложения товаров, которые могут заинтересовать покупателей определённой возрастной группы |
pandas, numpy, matplotlib, keras, компьютерное зрение, машинное обучение |
Предсказание температуры стали для металлургического комбината |
Построение модели для предсказания температуры стали. Полученное предсказание планируется использовать в дальнейшем для уменьшения потребления электроэнергии на этапе обработки стали, с целью оптимизации производственных расходов на металлургическом комбинате. |
pandas, sklearn, numpy, plotly, matplotlib, lightgbm, catboost |