Проект "Парсинг документов PEP" предназначен для удобства доступа к документации, теперь информация будет всегда под рукой. Развитие языка Python сопровождается документами PEP — Python Enhancement Proposal. К примеру:
- PEP 8 — Руководство по стилю кода Python
- PEP 20 — Дзен Python (The Zen of Python)
- PEP 257 — конвенция о докстрингах
- PEP 484 — подсказки типов (Type Hints)
- PEP 526 — аннотация переменных и так далее
Каждый из документов PEP относится к разным типам и может находиться в разных статусах.
У проекта есть 4 опции работы парсинга
pep
данные о статусе документа берутся со страницы каждого PEPwhats-new
собирает ссылки на статьи о нововведениях и прочую справочную информациюlatest-versions
собирает информацию о версиях Python: номера, статус и ссылки на документациюdownload
скачивает архив с документацией Python на локальный диск в директорию ./src/downloads/- Необязательные аргументы
-h
,--help
— выводит вспомогательную информацию о работе парсера-c
,--clear-cache
— удаляет cache пред стартом-o {pretty, file}
,--output {pretty, file}
— дополнительные способы вывода данных. Параметр 'pretty' выводит данные в терминале в виде таблицы, параметр 'file' сохраняет данные в csv-файл в директории results/.
- Клонируйте репозиторий и перейдите в него
https://github.com/whodef/bs4_parser_pep.git
- Установите и активируйте виртуальное окружение
python3 -m venv venv
- Установите зависимости из файла requirements.txt
pip3 install -r requirements.txt
- Через командную строку в директории src запустите скрипт:
Где
python3 main.py MODE -ARGS
MODE
— это название режима работы парсинга ('pep', 'whats-new', 'latest-versions', 'download'), а-ARGS
— это перечисление необязательных аргументов (--help, '--clear-cache' и т.д.).