Как-то раз, я решил, что время самому приложить руку к формированию будущего. И вот я тут. Здесь отражен мой путь в Data Science. Гитхаб служит своеобразной ретроспетивой и напоминанием: с чего я начинал и до чего, в итоге, добрался.
В разделе Образование и достижения можно ознакомиться с моими дипломами, сертификатами и ссылками на профильные соцсети (Kaggle, Leetcode, CodeWars). Тут же можно найти все вехи обучения и мероприятий, в которых я участвовал.
В разделе Репозитории проектов содержатся ссылки на отдельные репозитории, по тематикам выполненных проектов. Они содержат законченные проекты (для ретроспективы моего прогресса в Data Science, Data Analysis и ML). Каждый репозиторий снабжен удобной таблицей, включающей наименование проекта, его краткое описание и ссылки на github / сторонний сервис nbviewer. Эта же таблица продублирована ниже, в разделе Завершенные проекты.
- Репозитарий проектов Data Science: Deep Learning
- Репозитарий проектов Data Science: классический ML
- Репозитарий проектов Data Analysis
- Алгоритмы
Проект | Описание проекта |
---|---|
01. Определение возраста по фотографии (github / nbviewer) | ResNet50, CNN, загрузчики |
02. Набор скриптов для обучения разных архитектур CV (github) | FCN, CNN, LeNet, ResNet50, аугментация, загрузчики |
03. SGD pytorch (github) | SGD, torch, loss function |
04. DNN/CNN baseline on pytorch (github / nbviewer) | DNN/CNN baseline, torch |
Проект | Описание проекта |
---|---|
01. Рекомендация тарифов клиентам телекома (github / nbviewer) | Простая классификация и подбор гиперпараметра |
02. Прогноз оттока клиентов банка (github / nbviewer) | Классификация, f1, auc, roc_auc |
03. Выбор локации для скважины (github / nbviewer) | Прогноз прибыли, bootstrap, бизнес-применимость, точка безубыточности |
04. Коэффициент восстановления золота из золотосодержащей руды (github / nbviewer) | Машинное обучение, предобработка данных, визуализация, проверка гипотез. Построение модели для промышленной компании |
05. Защита персональных данных клиентов (github / nbviewer) | Теоретическое доказательство неизменности предсказаний линейной регрессии при умножении матрицы признаков на случайную матрицу, подготовка класса шифратора |
06. Прогноз оттока и калстеризация клиентов фитнес-центра (github / nbviewer) | Прогноз оттока (классификация), кластеризация пользователей (kmeans, dendrogram, linkage), анализ кластеров |
07. Определение стоимости автомобилей (github / nbviewer) | Численные методы, алгоритм градиентного спуска, градиентный бустинг |
08. Прогнозирование заказов такси (github / nbviewer) | Временные ряды, стационарность ряда, дифференцирование ряда, подбор параметров ARIMA, предсказание |
09. Классификация токсичности текста (github / nbviewer) | Классификация токсичности текста, TF-IDF, BERT-embeddings |
10. Прогнозирование оттока клиентов в телекоме (github / nbviewer) | Различные способы классификации (классические алгоритмы, стакинг на основе нейросети), feature engineering, пайплайн для полной автоматизации, бизнес-рекомендации |
11. Линейная, LASSO, Ridge регрессии, elasticnet и их оптимизация с нуля (github / nbviewer) | linreg, logreg, l1, l2, elasticnet, mini-batch generator |
Проект | Описание проекта |
---|---|
01. Исследование надежности клиентов банка (github / nbviewer) | Анализ, стемматизация, выявление лемм |
02. Исследование рынка недвижимости (github / nbviewer) | Анализ ценообразования, словари, очистка грязных данных |
03. Сравнительный анализ тарифов телекома (github / nbviewer) | Сегментация пользователей, определение подходящих тарифов, словари, очистка грязных данных |
04. Исследование успешности игровых проектов (github / nbviewer) | Анализ данных, визуализация, статистические проверки |
05. Анализ бизнес-показателей (github / nbviewer) | DAU, WAU, MAU, RR, LTV, CAC, ROMI, когортный анализ |
06. Принятие решений в бизнесе на основе данных (github / nbviewer) | Приоритизация гипотез, А/В тестирование |
07. Исследование рынка заведений общественного питания (github / nbviewer) | Анализ, визуализация, формирование словарей |
08. Поведение пользователей и результаты А/А/В-теста (github / nbviewer) | Исследование поведения пользователей, воронка активностей, результаты А/А/В-теста |
09. SQL анализ базы данных сервиса для чтения книг (github / nbviewer) | SQL-запросы и анализ, sqlalchemy |
10. Сегментация клиентов банка (github / nbviewer) | Сегментация и обработка выбросов, статистическая проверка гипотез |
11. Анализ результатов АВ-тестирования (github / nbviewer) | Подбор и подготовка данных, анализ результатов, z-тестирование результатов |