В данном репозитории расположены проекты, основанные на реальных данных, которые были в качестве домашнего задания в рамках обучения по курсу "Аналитик данных" на платфоре Яндекс.Практикум.
Всего 12 проектов, 2 из них сборных (содежащие в себе задания по пройденным темам), 1 выпускной проект и 9 тематических.
Каждая папка проекта содержит название пройденной темы обучения, название проекта содержит название исследования/анализа:
п/п | Название проекта | Задача | Навыки и инструменты |
---|---|---|---|
1. | Исследование надёжности заёмщиков | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | предобработка данных, Python, Pandas, PyMystem3, лемматизация |
2. | Исследование объявлений о продаже квартир | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Python, Pandas, Matplotlib, исследовательский анализ данных, визуализация данных, предобработка данных |
3. | Определение перспективного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | Python, Pandas, Matplotlib, NumPy, SciPy, описательная статистика, проверка статистических гипотез |
4. | Определение закономерностей успешности компьютерных игр | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры | Python, Pandas, NumPy, Matplotlib, предобработка данных, исследовательский анализ данных, описательная статистика, проверка статистических гипотез |
5. | Аналитика в авиакомпании | Произвести выгрузки и подготовку данных авиакомпаний с помощью SQL, проверить гипотезу о различии среднего спроса на билеты во время различных событий | SQL, Python, Pandas, Matplotlib, SciPy, проверка статистических гипотез |
6. | Анализ источников трафика и перераспределение бюджета отдела маркетинговой аналитики Яндекс.Афиши | На основе данных о посещениях сайта Яндекс.Афиши изучить, как люди пользуются продуктом, когда они начинают покупать, сколько денег приносит каждый клиент, когда он окупается | Python, Pandas, Matplotlib, когортный анализ, юнит-экономика, продуктовые метрики |
7. | Приоритезация гипотез и анализ A-B теста для увеличения выручки крупного интернет-магазина | Используя данные интернет-магазина приоритезировать гипотезы, произвести оценку результатов A/B-тестирования различными методами | Python, Pandas, Matplotlib, SciPy, A/B-тестирование, проверка статистических гипотез |
8. | Исследование рынка заведений общественного питания Москвы | Исследование рынка общественного питания на основе открытых данных, подготовка презентации для инвесторов | Python, Pandas, Seaborn, визуализация данных |
9. | Исследование поведения пользователей в мобильном приложении продажи продуктов питания | На основе данных использования мобильного приложения для продажи продуктов питания проанализировать воронку продаж, а также оценить результаты A/A/B-тестирования | A/B-тестирование, Python, Pandas, Matplotlib, Seaborn, событийная аналитика, продуктовые метрики, проверка статистических гипотез, визуализация данных |
10. | Анализ взаимодействия пользователей с карточками Яндекс.Дзен | Используя данные Яндекс.Дзена построить дашборд с метриками взаимодействия пользователей с карточками статей | Python, SQLAlchemy, PostgreSQL, dash, Tableau, продуктовые метрики, построение дашбордов |
11. | Разработка стратегии взаимодействия с пользователями на основе аналитических данных | На основе данных о посетителях сети фитнес-центров спрогнозировать вероятность оттока для каждого клиента в следующем месяце, сформировать с помощью кластеризации портреты пользователей | Python, Pandas, Scikit-learn, Matplotlib, Seaborn, машинное обучение, классификация, кластеризация |
12. | Выпускной проект: | ||
1. Определение неэффективных операторов телеком-компании «Нупозвони» | Определить самых неэффективных операторов по определенным признакам низкой эффективности | Python, Pandas, Matplotlib, предобработка данных, исследовательский анализ данных, визуализация данных, проверка статистических гипотез, построение дашбордов и презентации | |
2. Оценка результатов A-B-теста | По данным действий пользователей необходимо оценить корректность проведения A/B теста и проанализировать результаты | Python, Pandas, Matplotlib, SciPy, A/B-тестирование, проверка статистических гипотез | |
3. Книжное дело | Компанией было приобретен крупный сервис для чтения книг по подписке. Необходимо проанализировать имеющуюся информацию и определить направления развития | SQL, Python |