Мои проекты от Яндекс.Практикума по профессии "Аналитик данных" 📊

Структура репозитория:

📚 Проект 🖼 Описание ⚙️ Инструменты и технологии
Исследование для авиакомпании: анализ спроса пассажиров на рейсы в города, где проходят крупнейшие фестивали Изучение предпочтений пользователей, покупающих авиа-билеты на разные внутренние направления pandas, matplotlib, предобработка данных, визуализация barplot
Исследование надежности заемщиков для кредитного отдела банка Анализ влияния различных обстоятельств жизни клиентов на факт погашения кредита в срок pandas, pymystem3, предобработка данных, работа с артефактами, лемматизация, категоризация, конверсии по категориям, визуализация barplot
Выявление профилей потребления среди покупателей интернет-магазина Выделение наиболее ярких групп покупателей для разработки персонализированных предложений pandas, matplotlib, seaborn, nltk, pymystem3, sklearn, imblearn, numpy, scipy, предобработка данных, EDA, средние значения, стандартные отклонения, гистограммы, матрица корреляций, heatmap, парсинг, лемматизация, обучение модели ML, оценка качества модели, категоризация, визуализация, модель кластеризации алгоритмом K-Means, матрица расстояний, дендрограмма, silhouette score, проверка гипотез t-критерием Стьюдента, множественная проверка гипотез, презентация, дашборд на Tableau Public
Приоритизация гипотез и анализ результатов A/B-теста для интернет-магазина Приоритизация гипотез по увеличению выручки по фреймворкам ICE и RICE, анализ результатов A/B-теста для маркетологов pandas, matplotlib, datetime, numpy, scipy, предобработка данных, приоритизация гипотез по фреймворкам ICE, RICE, визуализация кумулятивной выручки, среднего чека, конверсии по группам A/B-теста, относительного изменения кумулятивного среднего чека и конверсии группы B к группе A, точечный график, выборочные перцентили, статистическая значимость критерием Манна-Уитни
Определение закономерностей, влияющих на успешность компьютерной игры Анализ данных о продажах игр, оценках пользователей и экспертов, жанрах и платформах для планирования рекламной кампании игрового интернет-магазина pandas, numpy, matplotlib, scipy, предобработка данных, EDA, визуализация, диграммы размаха boxplot, диаграммы рассеяния scatter matrix, коэффициенты корреляции, портреты пользователей, проверка гипотез t-критерием Стьюдента
Разработка стратегии взаимодействия с клиентами для сети фитнес-центров Прогноз вероятности оттока клиентов, формирование портретов клиентов, разработка рекомендаций по снижению оттока pandas, matplotlib, seaborn, sklearn, scipy, предобработка данных, EDA, средние значения, старндартные отклонения, гистограммы, матрица корреляций, heatmap, модель бинарной классификации, сравнение моделей логистической регрессии и случайного леса, accuracy score, precision score, recall score, f1 score, ROC AUC, интерпретация модели, матрица расстояний, дендрограмма, модель кластеризации алгоритмом K-Means, silhouette score
Анализ поведения пользователей мобильного приложения Изучение воронки продаж (как пользователи доходят до покупки), исследование результатов A/A/B-эксперимента по изменению шрифта в приложении pandas, matplotlib, plotly, datetime, numpy, scipy, math, предобработка данных, EDA, гистограммы, воронка событий, попарный z-тест для проверки гипотез
Анализ рынка заведений общественного питания Москвы Исследование с целью привлечения инвестиций на открытие кафе в Москве, подготовка рекомендаций о виде заведения для открытия, количестве посадочных мест, районе расположения, а также о возможности развития сети pandas, matplotlib, seaborn, re, pymystem3, BeautifulSoup, requests, json, предобработка данных, EDA, визуализация countplot, barplot, гистограммы, лемматизация, парсинг, презентация
Исследование объявлений о продаже квартир Анализ данных о продаже квартир в Санкт-Петербурге и соседних населенных пунктах, чтобы установить параметры для определения рыночной стоимости квартиры pandas, matplotlib, предобработка данных, EDA, гистограммы, матрицы корреляции, диаграммы рассеяния, визуализация barplot
Оценка результатов A/B-теста по внедрению улучшенной рекомендательной системы в интернет-магазине Оценка соответствия проведенного A/B-теста техническому заданию и анализ его результатов pandas, matplotlib, seaborn, plotly, datetime, numpy, scipy, math, предобработка данных, EDA, визуализация, гистограммы, конверсия в воронке событий, z-тест для проверки гипотез
Определение перспективного тарифа для оператора сотовой связи Анализ двух тарифов на небольшой выборке клиентов, чтобы телеком-компания смогла скорректировать рекламный бюджет pandas, math, matplotlib, numpy, scipy, предобработка данных, EDA, средние значения, дисперсии, стандартные отклонения, гистограммы, проверка гипотез t-критерием Стьюдента
Аналитика в Яндекс.Афише: оптимизация маркетинговых затрат Анализ данных о посещениях сайта Яндекс.Афиши, информации о заказах, статистики рекламных расходов pandas, matplotlib, seaborn, numpy, предобработка данных, визуализация, гистрограммы, heatmap, когортный анализ, DAU, WAU, MAU, sticky factor, ASL, retention rate по когортам пользователей, средний чек по когортам, LTV, САС, ROMI