/Yandex_Prakticum

Repository for my projects from the Data Analyst course

Primary LanguageJupyter Notebook

Яндекс.Практикум, курс "Аналитик данных"

В данном репозитории расположены проекты, основанные на реальных данных, которые были в качестве домашнего задания в рамках обучения по курсу "Аналитик данных" на платфоре Яндекс.Практикум.

Всего 12 проектов, 2 из них сборных (содежащие в себе задания по пройденным темам), 1 выпускной проект и 9 тематических.

Каждая папка проекта содержит название пройденной темы обучения, название проекта содержит название исследования/анализа:

п/п Название проекта Задача Навыки и инструменты
1. Исследование надёжности заёмщиков На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок предобработка данных, Python, Pandas, PyMystem3, лемматизация
2. Исследование объявлений о продаже квартир Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир Python, Pandas, Matplotlib, исследовательский анализ данных, визуализация данных, предобработка данных
3. Определение перспективного тарифа для телеком компании На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа Python, Pandas, Matplotlib, NumPy, SciPy, описательная статистика, проверка статистических гипотез
4. Определение закономерностей успешности компьютерных игр Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры Python, Pandas, NumPy, Matplotlib, предобработка данных, исследовательский анализ данных, описательная статистика, проверка статистических гипотез
5. Аналитика в авиакомпании Произвести выгрузки и подготовку данных авиакомпаний с помощью SQL, проверить гипотезу о различии среднего спроса на билеты во время различных событий SQL, Python, Pandas, Matplotlib, SciPy, проверка статистических гипотез
6. Анализ источников трафика и перераспределение бюджета отдела маркетинговой аналитики Яндекс.Афиши На основе данных о посещениях сайта Яндекс.Афиши изучить, как люди пользуются продуктом, когда они начинают покупать, сколько денег приносит каждый клиент, когда он окупается Python, Pandas, Matplotlib, когортный анализ, юнит-экономика, продуктовые метрики
7. Приоритезация гипотез и анализ A-B теста для увеличения выручки крупного интернет-магазина Используя данные интернет-магазина приоритезировать гипотезы, произвести оценку результатов A/B-тестирования различными методами Python, Pandas, Matplotlib, SciPy, A/B-тестирование, проверка статистических гипотез
8. Исследование рынка заведений общественного питания Москвы Исследование рынка общественного питания на основе открытых данных, подготовка презентации для инвесторов Python, Pandas, Seaborn, визуализация данных
9. Исследование поведения пользователей в мобильном приложении продажи продуктов питания На основе данных использования мобильного приложения для продажи продуктов питания проанализировать воронку продаж, а также оценить результаты A/A/B-тестирования A/B-тестирование, Python, Pandas, Matplotlib, Seaborn, событийная аналитика, продуктовые метрики, проверка статистических гипотез, визуализация данных
10. Анализ взаимодействия пользователей с карточками Яндекс.Дзен Используя данные Яндекс.Дзена построить дашборд с метриками взаимодействия пользователей с карточками статей Python, SQLAlchemy, PostgreSQL, dash, Tableau, продуктовые метрики, построение дашбордов
11. Разработка стратегии взаимодействия с пользователями на основе аналитических данных На основе данных о посетителях сети фитнес-центров спрогнозировать вероятность оттока для каждого клиента в следующем месяце, сформировать с помощью кластеризации портреты пользователей Python, Pandas, Scikit-learn, Matplotlib, Seaborn, машинное обучение, классификация, кластеризация
12. Выпускной проект:
1. Определение неэффективных операторов телеком-компании «Нупозвони» Определить самых неэффективных операторов по определенным признакам низкой эффективности Python, Pandas, Matplotlib, предобработка данных, исследовательский анализ данных, визуализация данных, проверка статистических гипотез, построение дашбордов и презентации
2. Оценка результатов A-B-теста По данным действий пользователей необходимо оценить корректность проведения A/B теста и проанализировать результаты Python, Pandas, Matplotlib, SciPy, A/B-тестирование, проверка статистических гипотез
3. Книжное дело Компанией было приобретен крупный сервис для чтения книг по подписке. Необходимо проанализировать имеющуюся информацию и определить направления развития SQL, Python