/best

Primary LanguageJupyter Notebook

Cross Cell

чтобы запустить модель, нужно сначала склонировать репозиторий, а потом выполнить комманду внутри папки с файлами из этого репозитория

pip install requirements.txt

Тем самым, Вы установите все необходимые библиотеки для выполнения моделированния Чтобы выполнить моделирование, вам необходимо выполнить комманду

python main.py [путь к тренировочной таблице] [путь в тестовой таблице]

Пример

python main.py Dannye_po_Data_Motiv.xlsx Data_Motiv_2.xlsx

Где Dannye_po_Data_Motiv.xlsx - это таблица с данными, на которых обучается модель. А Data_Motiv_2.xlsx - таблица по которой мы хотим получчить результат выполнения модели Cross Cell

Как модель Cross Cell работает ?

Для обучения модели используется тренировочная таблица. Сначала эта таблица отчищается от строк, в которых пропущены значения. Потом из этой таблицы выбираются люди, о которых есть 3 записи. После эта группа людей делится на тех, кто за 3 месяца сменил тариф, и на тех, кто остался на прежнем тарифе. Именно так определяется генеральная совокупность. Далее формируется сбалансированная выборка, в которой 50% переходили на другой тариф, а остальные 50% - нет. Из этой выборки формируюстя новые признаки. А именно берется у каждого человека среднее значение, медиана, среднее отклонение, размах по признакам человека. И на этих новых признаках обучается модель Cross Cell

Результат работы модели Cross Cell формируется в таблице solution.csv. Где 1 столбец - это индексы, 2 - вероятность того, что человек не поменял тариф и 3 - вероятность того, что человек поменял тариф