Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме по программе "Аналитик Данных"
Название проекта | Сфера деятельности | Навыки и инструменты | Задачи проекта |
---|---|---|---|
1. Сегментация покупателей интернет-магазина на основе их профиля потребления | E-commerce | Pandas, NumPy, Matplotlib, Seaborn, Plotly, SciPy, PyMystem3, Scikit-learn, Tableau, предобработка данных, исследовательский анализ, кластеризация, проверка стат.гипотез, продуктовые метрики | На основе данных по транзакциям клиентов провести их сегментацию для разработки персонализированных предложений |
2. Исследование надежности заемщиков анализ банковских данных | Банковская сфера Кредитование | Pandas, PyMystem3, Python, лемматизация, предобработка данных | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок |
3. Продажа квартир в Санкт-Петербурге - анализ рынка недвижимости | Интернет-сервисы Площадки объявлений | Matplotlib, Pandas, Python, визуализация данных, исследовательский анализ, предобработка данных | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир |
4. Определение выгодного тарифа для телеком компании | Телеком | Matplotlib, Pandas, NumPy, Python, SciPy, описательная статистика, проверка стат.гипотез | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа |
5. Изучение закономерностей, определяющих успешность игр | Gamedev | Matplotlib, Pandas, NumPy, Python, SciPy, описательная статистика, исследовательский анализ, предобработка, проверка стат.гипотез | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры |
6. Исследование данных авиакомпании - гипотеза о повышении спроса во время фестивалей | Авиакомпании | Matplotlib, Pandas, Python, SciPy, SQL, проверка стат.гипотез | Произвести выгрузки и подготовку данных авиакомпаний с помощью SQL, проверить гипотезу о различии среднего спроса на билеты во время различных событий |
7. Оптимизация маркетинговых затрат в Яндекс-Афише | Интернет-сервисы | Matplotlib, Pandas, Python, когортный анализ, продуктовые метрики, юнит-экономика | На основе данных о посещениях сайта Яндекс.Афиши изучить, как люди пользуются продуктом, когда они начинают покупать, сколько денег приносит каждый клиент, когда он окупается |
8. Проверка гипотез по увеличению выручки в интернет-магазине - анализ A/B теста | E-commerce | A/B - тестирование, Matplotlib, Pandas, Python, SciPy, проверка стат.гипотез | Используя данные интернет-магазина приоритезировать гипотезы, произвести оценку результатов A/B-тестирования различными методами |
9. Исследование рынка общепита в Москве для принятия решения об открытии заведения | Оффлайн | Plotly, Pandas, Python, Seaborn, визуализация данных | Исследование рынка общественного питания на основе открытых данных, подготовка презентации для инвесторов |
10. Анализ пользовательского поведения в мобильном приложении | Мобильные приложения | A/B - тестирование, Plotly, Pandas, Matplotlib, Python, Seaborn, визуализация данных, проверка стат.гипотез, продуктовые метрики, событийная аналитика | На основе данных использования мобильного приложения для продажи продуктов питания проанализировать воронку продаж, а также оценить результаты A/A/Bтестирования |
11. Создание дашборда по пользовательским событиям для агрегатора новостей | Интернет-сервисы | PostgreSQL, Python, SQLAlchemy, Tableau, Dash, продуктовые метрики, построение дашбордов | Используя данные Яндекс.Дзена построить дашборд с метриками взаимодействия пользователей с карточками статей |
12. Прогнозирование вероятности оттока пользователей для фитнес-центра | Интернет-сервисы | Matplotlib, Pandas, Python, Seaborn, Scikit-learn, классификация, кластеризация, машинное обучение | На основе данных о посетителях сети фитнес-центров спрогнозировать вероятность оттока для каждого клиента в следующем месяце, сформировать с помощью кластеризации портреты пользователей |