pyspark second lab task
Цель работы: Получить навыки работы со Spark. По имеющимся данным: https://files.grouplens.org/datasets/movielens/ml-20mx16x32.tar построить content-based рекомендации по образовательным курсам.
Запрещено использовать библиотеки pandas, sklearn и аналогичные.
Дополнительное задание: построить полный CI/CD цикл модели с использованием Docker/Jenkins/подходов тестирования