Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессии "Специалист по Data Science".
Название проекта | Описание | Используемые библиотеки | Статус |
---|---|---|---|
Исследование объявлений о продаже квартир | Используя данные сервиса Яндекс.Недвижимость, нужно научиться определять рыночную стоимость объектов недвижимости | Pandas, Matplotlib, Seaborn | Завершён |
Определение выгодного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | Pandas, Matplotlib, NumPy, SciPy, Seaborn | Завершён |
Определение успешности игры | Выявить определяющие успешность игры закономерности. Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании. | Pandas, Matplotlib, NumPy, SciPy, Seaborn | Завершён |
Рекомендация тарифов | Построить модель для задачи классификации, которая выберет подходящий тариф | Pandas, Matplotlib, Scikit-learn | Завершён |
Прогнозирование оттока клиента Банка | На основе данных из банка определить клиента, который может уйти | Pandas, Matplotlib, Scikit-learn | Завершён |
Определение прибыльного региона для нефтедобывающей компании | Поиск прибыльного нефтедобывающего региона с помощью моделирования машинного обучения | Pandas, Numpy, Seaborn, Scikit-learn, Bootstrap | Завершён |
Исследование технологического процесса очистки золота | Модель должна предсказать коэффициент восстановления золота из золотосодержащей руды на основе данных с параметрами добычи и очистки. | Pandas, Matplotlib, NumPy, Seaborn, Scikit-learn | Завершён |
Определение возраста покупателей | Построить модель, которая по фотографии определит приблизительный возраст человека. | Pandas, Numpy, Scikit-learn, Random | Завершён |
Определение стоимости автомобиля | Разработка системы рекомендации стоимости автомобиля на основе его описания. На основе исторические данные необходимо построить модель для определения стоимости автомобиля. | Pandas, Numpy, Scikit-learn, XGBoost, LightGBM, Matplotlib, Seaborn, Scipy | Завершён |
Прогноз заказов такси на следующий час | Разработка системы предсказания количество заказов такси. | Pandas, Numpy, Scikit-learn, XGBoost, LightGBM, Seaborn, Statsmodels | Завершён |
Определение токсичных комментариев | Поиск токсичных комментариев и отправка их на модернизацию. Классификация комментариев на позитивные и негативные. | Pandas, Numpy, Seaborn, tf-idf, nltk, pipeline, LinearRegression, LightGBM | Завершён |
Прогнозирование оттока клиентов телеком | Построить модель, которая предсказывает, уйдёт ли пользователь. | pandas, matplotlib, seaborn, datetime, random, ProfileReport, phik, sklearn.metrics, lightgbm, catboost, RandomForestClassifier, LogisticRegression, Scikit-learn, Pipeline | Завершён |