Скрипт считывает xml https://www.coursera.org/sitemap~www~courses.xml. И парсит первые 20 курсов, данные о курсах сохраняет в файл
Для работы необходимо установить модули из requirements.txt
под администратором/рутом выполнить: pip install -r requirements.txt
Для скрипта доступен параметр имени выходного файла:-o <file_name>
или --output <file_name>
.
Если не задавать выходной файл, данные будут сохранены в output.xlsx
Пример запуска в консоли:
$ python coursera.py -o courseradump.xlsx
The data saved as courseradump.xlsx
The code is written for educational purposes. Training course for web-developers - DEVMAN.org