Структура репозитория:
📚 Проект | 🖼 Описание | ⚙️ Инструменты и технологии |
---|---|---|
Исследование для авиакомпании: анализ спроса пассажиров на рейсы в города, где проходят крупнейшие фестивали | Изучение предпочтений пользователей, покупающих авиа-билеты на разные внутренние направления | pandas , matplotlib , предобработка данных, визуализация barplot |
Исследование надежности заемщиков для кредитного отдела банка | Анализ влияния различных обстоятельств жизни клиентов на факт погашения кредита в срок | pandas , pymystem3 , предобработка данных, работа с артефактами, лемматизация, категоризация, конверсии по категориям, визуализация barplot |
Выявление профилей потребления среди покупателей интернет-магазина | Выделение наиболее ярких групп покупателей для разработки персонализированных предложений | pandas , matplotlib , seaborn , nltk , pymystem3 , sklearn , imblearn , numpy , scipy , предобработка данных, EDA, средние значения, стандартные отклонения, гистограммы, матрица корреляций, heatmap , парсинг, лемматизация, обучение модели ML, оценка качества модели, категоризация, визуализация, модель кластеризации алгоритмом K-Means , матрица расстояний, дендрограмма, silhouette score , проверка гипотез t-критерием Стьюдента, множественная проверка гипотез, презентация, дашборд на Tableau Public |
Приоритизация гипотез и анализ результатов A/B-теста для интернет-магазина | Приоритизация гипотез по увеличению выручки по фреймворкам ICE и RICE , анализ результатов A/B-теста для маркетологов |
pandas , matplotlib , datetime , numpy , scipy , предобработка данных, приоритизация гипотез по фреймворкам ICE , RICE , визуализация кумулятивной выручки, среднего чека, конверсии по группам A/B-теста, относительного изменения кумулятивного среднего чека и конверсии группы B к группе A, точечный график, выборочные перцентили, статистическая значимость критерием Манна-Уитни |
Определение закономерностей, влияющих на успешность компьютерной игры | Анализ данных о продажах игр, оценках пользователей и экспертов, жанрах и платформах для планирования рекламной кампании игрового интернет-магазина | pandas , numpy , matplotlib , scipy , предобработка данных, EDA, визуализация, диграммы размаха boxplot , диаграммы рассеяния scatter matrix , коэффициенты корреляции, портреты пользователей, проверка гипотез t-критерием Стьюдента |
Разработка стратегии взаимодействия с клиентами для сети фитнес-центров | Прогноз вероятности оттока клиентов, формирование портретов клиентов, разработка рекомендаций по снижению оттока | pandas , matplotlib , seaborn , sklearn , scipy , предобработка данных, EDA, средние значения, старндартные отклонения, гистограммы, матрица корреляций, heatmap , модель бинарной классификации, сравнение моделей логистической регрессии и случайного леса, accuracy score , precision score , recall score , f1 score , ROC AUC , интерпретация модели, матрица расстояний, дендрограмма, модель кластеризации алгоритмом K-Means , silhouette score |
Анализ поведения пользователей мобильного приложения | Изучение воронки продаж (как пользователи доходят до покупки), исследование результатов A/A/B-эксперимента по изменению шрифта в приложении | pandas , matplotlib , plotly , datetime , numpy , scipy , math , предобработка данных, EDA, гистограммы, воронка событий, попарный z-тест для проверки гипотез |
Анализ рынка заведений общественного питания Москвы | Исследование с целью привлечения инвестиций на открытие кафе в Москве, подготовка рекомендаций о виде заведения для открытия, количестве посадочных мест, районе расположения, а также о возможности развития сети | pandas , matplotlib , seaborn , re , pymystem3 , BeautifulSoup , requests , json , предобработка данных, EDA, визуализация countplot , barplot , гистограммы, лемматизация, парсинг, презентация |
Исследование объявлений о продаже квартир | Анализ данных о продаже квартир в Санкт-Петербурге и соседних населенных пунктах, чтобы установить параметры для определения рыночной стоимости квартиры | pandas , matplotlib , предобработка данных, EDA, гистограммы, матрицы корреляции, диаграммы рассеяния, визуализация barplot |
Оценка результатов A/B-теста по внедрению улучшенной рекомендательной системы в интернет-магазине | Оценка соответствия проведенного A/B-теста техническому заданию и анализ его результатов | pandas , matplotlib , seaborn , plotly , datetime , numpy , scipy , math , предобработка данных, EDA, визуализация, гистограммы, конверсия в воронке событий, z-тест для проверки гипотез |
Определение перспективного тарифа для оператора сотовой связи | Анализ двух тарифов на небольшой выборке клиентов, чтобы телеком-компания смогла скорректировать рекламный бюджет | pandas , math , matplotlib , numpy , scipy , предобработка данных, EDA, средние значения, дисперсии, стандартные отклонения, гистограммы, проверка гипотез t-критерием Стьюдента |
Аналитика в Яндекс.Афише: оптимизация маркетинговых затрат | Анализ данных о посещениях сайта Яндекс.Афиши, информации о заказах, статистики рекламных расходов | pandas , matplotlib , seaborn , numpy , предобработка данных, визуализация, гистрограммы, heatmap , когортный анализ, DAU , WAU , MAU , sticky factor , ASL , retention rate по когортам пользователей, средний чек по когортам, LTV , САС , ROMI |