Генетическое зельеварение

Продукт "Генетическое зельеварение" проект в рамках зимней школы CompTech School 2022

Назначение

Продукт "Генетическое зельеварение" в рамках зимней школы CompTech School 2022 разрабатывается с целью улучшения работы линейной модели классификации, на основе использования генетического алгоритма.

Папки репозитория

  • docs - папка, содержащая документацию проекта;
  • main.py - файл, содержащий алгоритм.

Обзор продукта

Алгоритм, создающий признаки, которые улучшают результаты работы линейной модели классификации. Данный алгоритм является эффективным способом оптимизации решений с большим числом параметров. Идея заключается в комбинировании существующих параметров, путем создания новых, с возможностью дальнейшей визуализации.

Структура продукта

  • Сначала формируется начальное поколение - популяция деревьев.
  • Затем осуществляется селекция, то есть выбор подходящих индивидов на основе fitness-функции.
  • Затем на стадии рекомбинации происходит обмен частями деревьев.
  • На этапе мутаций случайно меняются части деревьев и на выходе получается новая популяция.
  • Если цель не была достигнута, то операции повторяются сначала до ее достижения.

image

Применение

  • Любая область, где могут быть применены методы машинного обучения для обработки данных. От банковской сферы до медицины.
  • Может быть применен для решения различных комбинаторных задач, к которым относятся задачи компоновки, задачи на графах и прочие.
  • Применяется для ускорения настройки нейронных сетей.

Уcтановка и настройка

Установка

Впишите команду: pip install geneticpotion #installing package.

Запуск

Впишите команду: from geneticpotion import potion as p # importing package lr = LogisticRegression() #or any other ml model from sklearn.linear_model pot = p.Potion(lr) #creating genetic algorithm enhancer pot.fit(x_train, y_train, x_test, y_test) #training pot.predict(data_x) #predicting.

Роли в команде

  • Косарецкий Егор - Data Scientist
  • Гераскин Степан - Data Scientist
  • Кристина Светова - Визуализатор
  • Шперлинг Софья - Data Scientist
  • Писарькова Валерия - Data Scientist
  • Новикова Валентина - Технический писатель

Куратор

Радеев Никита Андреевич, Machine Learning Engineer, Новосибирский Исследовательский центр ООО "Техкомпания Хуавей"