Здесь расположены учебные проекты, выполненные в ходе изучения курса "Аналитик данных" в Яндекс.Практикуме
Название проекта | Описание проекта | Инструменты |
---|---|---|
Исследование музыкальных предпочтений жителей Москвы и Питера | На основе статистики из Яндекс.Музыки выяснить, в какие дни недели и какое время суток моксвичи и питерцы чаще слушают музыку | Pandas |
Исследование надёжности заёмщиков — анализ банковских данных | На основе статистики о платёжеспособности клиентов исследовать, влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | предобработка данных, Python, Pandas, PyMystem3, лемматизация |
Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Python, Pandas, Matplotlib, исследовательский анализ данных, визуализация данных, предобработка данных |
Определение выгодного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | Python, Pandas, Matplotlib, NumPy, SciPy, описательная статистика, проверка статистических гипотез |
Изучение закономерностей, определяющих успешность игр | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры | Python, Pandas, NumPy, Matplotlib, предобработка данных, исследовательский анализ данных, описательная статистика, проверка статистических гипотез |
Исследование данных авиакомпании — проверка гипотезы о повышении спроса во время фестивалей | Произвести выгрузки и подготовку данных авиакомпаний с помощью SQL, проверить гипотезу о различии среднего спроса на билеты во время различных событий | SQL, Python, Pandas, Matplotlib, SciPy, проверка статистических гипотез |
Оптимизация маркетинговых затрат в Яндекс.Афише | На основе данных о посещениях сайта Яндекс.Афиши изучить, как люди пользуются продуктом, когда они начинают покупать, сколько денег приносит каждый клиент, когда он окупается | Python, Pandas, Matplotlib, когортный анализ, юнит-экономика, продуктовые метрики |
Проверка гипотез по увеличению выручки в интернет-магазине — оценка результатов A/B теста | Используя данные интернет-магазина приоритезировать гипотезы, произвести оценку результатов A/B-тестирования различными методами | Python, Pandas, Matplotlib, SciPy, A/B-тестирование, проверка статистических гипотез |
Исследование рынка общепита в Москве для принятия решения об открытии нового заведения | Исследование рынка общественного питания на основе открытых данных, подготовка презентации для инвесторов | Python, Pandas, Seaborn, Plotly, визуализация данных |
Анализ пользовательского поведения в мобильном приложении | На основе данных использования мобильного приложения для продажи продуктов питания проанализировать воронку продаж, а также оценить результаты A/A/B-тестирования | A/B-тестирование, Python, Pandas, Matplotlib, Seaborn, событийная аналитика, продуктовые метрики, Plotly, проверка статистических гипотез, визуализация данных |
Создание дашборда по пользовательским событиям для агрегатора новостей | Используя данные Яндекс.Дзена, построить дашборд с метриками взаимодействия пользователей с карточками статей | Python, SQLAlchemy, PostgreSQL, dash, Tableau, продуктовые метрики, построение дашбордов |
Прогнозирование вероятности оттока пользователей для фитнес-центров | На основе данных о посетителях сети фитнес-центров спрогнозировать вероятность оттока для каждого клиента в следующем месяце, сформировать с помощью кластеризации портреты пользователей | Python, Pandas, Scikit-learn, Matplotlib, Seaborn, машинное обучение, классификация, кластеризация |
Анализ А/В теста для мобильного приложения | Провести оценку корректности проведения А/В теста на основе полученных с егоп омощью данных | pandas, math, numpy, stats, matplotlib, seaborn, plotly |
SQL-запросы из базы данных приложения для чтения книг | Используя базу данных приложения для чтения книг, определить самых популярных авторов с учетом различных условий | pandas, create_engine, SQL |
Создание дашборда для мобильного приложения | Используя дамп базы данных мобильного приложения по продаже ненужных вещей, построить дашборд с метриками количества событий по дням и типам событий | pandas, math, numpy, scipy, plotly.express, graph_objects, matplotlib.pyplot, seaborn, matplotlib.dates, simplefilter, sys, getopt, datetime, plotly.graph_objs, dash, dash_core_components, dash_html_components, dash.dependencies |