/urzumo

Content, description and examples of my comprehension of the art of date research

Привет!

Как-то раз, я решил, что время самому приложить руку к формированию будущего. И вот я тут. Здесь отражен мой путь в Data Science. Гитхаб служит своеобразной ретроспетивой и напоминанием: с чего я начинал и до чего, в итоге, добрался.

В разделе Образование и достижения можно ознакомиться с моими дипломами, сертификатами и ссылками на профильные соцсети (Kaggle, Leetcode, CodeWars). Тут же можно найти все вехи обучения и мероприятий, в которых я участвовал.

В разделе Репозитории проектов содержатся ссылки на отдельные репозитории, по тематикам выполненных проектов. Они содержат законченные проекты (для ретроспективы моего прогресса в Data Science, Data Analysis и ML). Каждый репозиторий снабжен удобной таблицей, включающей наименование проекта, его краткое описание и ссылки на github / сторонний сервис nbviewer. Эта же таблица продублирована ниже, в разделе Завершенные проекты.


Образование и достижения

  1. Дипломы и сертификаты
  2. Профиль на CodeWars
  3. Профиль на LeetCode
  4. Профиль на Kaggle

Репозитории проектов

  1. Репозитарий проектов Data Science: Deep Learning
  2. Репозитарий проектов Data Science: классический ML
  3. Репозитарий проектов Data Analysis
  4. Алгоритмы

Завершенные проекты

Data Science: Deep Learning

Проект Описание проекта
01. Определение возраста по фотографии (github / nbviewer) ResNet50, CNN, загрузчики
02. Набор скриптов для обучения разных архитектур CV (github) FCN, CNN, LeNet, ResNet50, аугментация, загрузчики
03. SGD pytorch (github) SGD, torch, loss function
04. DNN/CNN baseline on pytorch (github / nbviewer) DNN/CNN baseline, torch

Data Science: классический ML

Проект Описание проекта
01. Рекомендация тарифов клиентам телекома (github / nbviewer) Простая классификация и подбор гиперпараметра
02. Прогноз оттока клиентов банка (github / nbviewer) Классификация, f1, auc, roc_auc
03. Выбор локации для скважины (github / nbviewer) Прогноз прибыли, bootstrap, бизнес-применимость, точка безубыточности
04. Коэффициент восстановления золота из золотосодержащей руды (github / nbviewer) Машинное обучение, предобработка данных, визуализация, проверка гипотез. Построение модели для промышленной компании
05. Защита персональных данных клиентов (github / nbviewer) Теоретическое доказательство неизменности предсказаний линейной регрессии при умножении матрицы признаков на случайную матрицу, подготовка класса шифратора
06. Прогноз оттока и калстеризация клиентов фитнес-центра (github / nbviewer) Прогноз оттока (классификация), кластеризация пользователей (kmeans, dendrogram, linkage), анализ кластеров
07. Определение стоимости автомобилей (github / nbviewer) Численные методы, алгоритм градиентного спуска, градиентный бустинг
08. Прогнозирование заказов такси (github / nbviewer) Временные ряды, стационарность ряда, дифференцирование ряда, подбор параметров ARIMA, предсказание
09. Классификация токсичности текста (github / nbviewer) Классификация токсичности текста, TF-IDF, BERT-embeddings
10. Прогнозирование оттока клиентов в телекоме (github / nbviewer) Различные способы классификации (классические алгоритмы, стакинг на основе нейросети), feature engineering, пайплайн для полной автоматизации, бизнес-рекомендации
11. Линейная, LASSO, Ridge регрессии, elasticnet и их оптимизация с нуля (github / nbviewer) linreg, logreg, l1, l2, elasticnet, mini-batch generator

Data Analysis

Проект Описание проекта
01. Исследование надежности клиентов банка (github / nbviewer) Анализ, стемматизация, выявление лемм
02. Исследование рынка недвижимости (github / nbviewer) Анализ ценообразования, словари, очистка грязных данных
03. Сравнительный анализ тарифов телекома (github / nbviewer) Сегментация пользователей, определение подходящих тарифов, словари, очистка грязных данных
04. Исследование успешности игровых проектов (github / nbviewer) Анализ данных, визуализация, статистические проверки
05. Анализ бизнес-показателей (github / nbviewer) DAU, WAU, MAU, RR, LTV, CAC, ROMI, когортный анализ
06. Принятие решений в бизнесе на основе данных (github / nbviewer) Приоритизация гипотез, А/В тестирование
07. Исследование рынка заведений общественного питания (github / nbviewer) Анализ, визуализация, формирование словарей
08. Поведение пользователей и результаты А/А/В-теста (github / nbviewer) Исследование поведения пользователей, воронка активностей, результаты А/А/В-теста
09. SQL анализ базы данных сервиса для чтения книг (github / nbviewer) SQL-запросы и анализ, sqlalchemy
10. Сегментация клиентов банка (github / nbviewer) Сегментация и обработка выбросов, статистическая проверка гипотез
11. Анализ результатов АВ-тестирования (github / nbviewer) Подбор и подготовка данных, анализ результатов, z-тестирование результатов