Название Описание Keywords
Study of the reliability of borrowers - analysis of banking data # Based on the data of the bank’s credit department, he investigated the influence of the marital status and the number of children on the fact of repaying the loan on time. Information was obtained by the excited. Determined and processed gaps. Data types to corresponding to stored data are replaced. Duplicate are removed. Categorized data. One Datapham is decomposed by three. Data processing, duplicates, gaps, categorization, decomposition
Sale of apartments in St. Petersburg-Analysis of the real estate market # Internet services, ads# MatPlotlib, Pandas, Python, data visualization, data research, data expense# Based on the data of the Yandex.Mannia service, the market value of real estate of various types is determined, the typical parameters of the apartments, depending on the remoteness from the center. Data is carried out. New data has been added. Histograms, boxing, scattering diagrams are built. Categorization, ScatterPlot, Frod Monitoring Data processing, Histogram, Boxplot, ScatterMatrix
Определение выгодного тарифа для телеком компании # Телеком# Matplotlib,NumPy,Pandas,Python,SciPy,описательная статистика,проверка статистических гипотез# На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа Проведен предварительный анализ использования тарифов на выборке клиентов,проанализировано поведение клиентов при использовании услуг оператора и рекомендованы оптимальные наборы услуг для пользователей. Проведена предобработка данных, их анализ. Проверены гипотезы о различии выручки абонентов разных тарифов и различии выручки абонентов из Москвы и других регионов. критерий Стьюдента обработка данных, histogram, boxplot, статистический тест,
Продажа компьютерных игр
Разработка системы предупреждения аварий на каршеринге# Бизнес,Интернет-сервисы,Оффлайн# Pandas,PostgreSQL,SQL,SQLAlchemy,Scikit-learn# Построить систему предупреждения об аварии клиентам каршеринга На основе исторических данных из базы данных выявить причины возникновения аварий и создать алерт о безопасном вождении. Базы данных, синтез признаков
Классификаиция клиентов телеком компании# Телеком# Matplotlib,Pandas,Python,Scikit-learn# На основе данных предложить клиенту тариф. Оператор мобильной связи выяснил: многие клиенты пользуются архивными тарифами. Они хотят построить систему, способную проанализировать поведение клиентов и предложить пользователям один из новых тариф. классификация, подбор гиперпараметров, выбор модели МО
Прогнозирование оттока клиента Банка Нужно спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. Предоставлены исторические данные о поведении клиентов и расторжении договоров с банком. # Банковская сфера,Бизнес,Инвестиции,Кредитование# Matplotlib,Pandas,Scikit-learn# На основе данных из банка определить клиент, который может уйти Из банка стали уходить клиенты. Каждый месяц. Немного, но заметно. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых.
Определение наиболее выгодного региона нефтедобычи# Добывающие компании# Pandas,Scikit-learn,бутстреп# На основе данных геологи разведки выбрать район добычи нефти Вам предоставлены пробы нефти в трёх регионах. Характеристики для каждой скважины в регионе уже известны. Постройте модель для определения региона, где добыча принесёт наибольшую прибыль. регрессия, разработка бизнес-модели, бутстреп
Очистка золотосодержащей руды
9. Система прогнозирования продажи отелей# Интернет-сервисы,Туризм# Matplotlib,NumPy,Pandas,Python,Scikit-learn,исследовательский анализ данных# Спрогнозировать кто из клиентов откажется от брони Строится модель прогнозирования отказа от брони клиента. В качестве метрики предлагается использовать величину выручки которая получится после внедрения модели машинного обучения. Классификация, бизнес модель
Защита данных клиентов страховой компании# Банковская сфера,Инвестиции,Интернет-сервисы,Телеком# NumPy,Python,Scikit-learn# Разработка модели анонимизации персональных данных Необходимо защитить данные клиентов страховой компании «Хоть потоп». Разработайте такой метод преобразования данных, чтобы по ним было сложно восстановить персональную информацию. Обоснуйте корректность его работы. Нужно защитить данные, чтобы при преобразовании качество моделей машинного обучения не ухудшилось. Подбирать наилучшую модель не требуется. линейная алгебра, регрессия
Построение модели определения стоимости автомобиля# Бизнес,Интернет-магазины,Интернет-сервисы# Pandas,Python,lightgbm# Разработка системы рекомендации стоимости автомобиля на основе его описания Сервис по продаже автомобилей с пробегом разрабатывает приложение для привлечения новых клиентов. В нём можно быстро узнать рыночную стоимость своего автомобиля. На основе исторические данные необходимо построить модель для определения стоимости автомобиля. градиентный бустинг, регрессия
Прогнозирование количества заказов такси на следующий час# Бизнес,Интернет-сервисы,Стартапы# Pandas,Python,Scikit-learn,statsmodels# Разработка системы предсказания объема заказа. Компания такси собрала исторические данные о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. Строится модель для такого предсказания. временные ряды, регрессия, предсказания
13. Обучение модели классификации комментариев# Интернет-сервисы,Стартапы# BERT,Pandas,Python,nltk,tf-idf# Определение токсичности комментарии. Интернет-магазин запускает новый сервис. Теперь пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. То есть клиенты предлагают свои правки и комментируют изменения других. Требуется инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. обработка естественного языка, NLP
14. Обработка фотографий покупателя# Бизнес,Оффлайн# Keras,Python# Определение возраста по фотографии Сетевой супермаркет внедряет систему компьютерного зрения для обработки фотографий покупателей. Фотофиксация в прикассовой зоне поможет определять возраст клиентов, чтобы анализировать покупки и предлагать товары, которые могут заинтересовать покупателей этой возрастной группы и контролировать добросовестность кассиров при продаже алкоголя. Строится модель, которая по фотографии определит приблизительный возраст человека. В вашем распоряжении набор фотографий людей с указанием возраста. обработка изображени, нейронные сети
15. Прогнозирование стоимости жилья в жилом массиве.# Интернет-сервисы,Оффлайн,Площадки объявлений# Pandas,Python,Spark# Определить медианную стоимость квартиры Сервис по продаже квартир закала разработку модели по прогнозированию стоимости квартиры большие данные, Spark
16. Прогнозирование темпаратуры звезды# Science# Pandas,Python,Pytorch# Определить температуру на поверхности звезды На основе косвенных данных построить модель оценки температуры на поверхности звезды Нейронные сети
17. Поиск по изображению# Интернет-сервисы,Стартапы# BERT,Keras,Pytorch,Scikit-learn# Разработать простой поиск картинок по запросу Разработать модель соединяющую текстовые данные и изображения. Нейронные сети