чтобы запустить модель, нужно сначала склонировать репозиторий, а потом выполнить комманду внутри папки с файлами из этого репозитория
pip install requirements.txt
Тем самым, Вы установите все необходимые библиотеки для выполнения моделированния Чтобы выполнить моделирование, вам необходимо выполнить комманду
python main.py [путь к тренировочной таблице] [путь в тестовой таблице]
Пример
python main.py Dannye_po_Data_Motiv.xlsx Data_Motiv_2.xlsx
Где Dannye_po_Data_Motiv.xlsx - это таблица с данными, на которых обучается модель. А Data_Motiv_2.xlsx - таблица по которой мы хотим получчить результат выполнения модели Cross Cell
Для обучения модели используется тренировочная таблица. Сначала эта таблица отчищается от строк, в которых пропущены значения. Потом из этой таблицы выбираются люди, о которых есть 3 записи. После эта группа людей делится на тех, кто за 3 месяца сменил тариф, и на тех, кто остался на прежнем тарифе. Именно так определяется генеральная совокупность. Далее формируется сбалансированная выборка, в которой 50% переходили на другой тариф, а остальные 50% - нет. Из этой выборки формируюстя новые признаки. А именно берется у каждого человека среднее значение, медиана, среднее отклонение, размах по признакам человека. И на этих новых признаках обучается модель Cross Cell
Результат работы модели Cross Cell формируется в таблице solution.csv
. Где 1 столбец - это индексы, 2 - вероятность того, что человек не поменял тариф и 3 - вероятность того, что человек поменял тариф