Парсер ГПЗУ (градостроительного плана земельного участка), разработанный на «Лидерах цифровой трансформации — 2022» командой GPZU_leaders.
- Установить Docker.
- Скачать файлы из этого репозитория.
- Открыть папку, в которую скачали файлы, открыть в ней консоль и выполнить
docker build -t gpzuparse .
(точка тоже входит в команду). Эта команда собирает Docker-образ, внутри которого работает приложение. Дождаться, пока образ соберётся (время зависит от мощности компьютера и скорости Интернета, так как много информации загружается из Интернета). - Там же выполнить
docker run --name gpzu_parser -dp 80:80 gpzuparse
. Эта команда запускает только что собранный образ, даёт ему имяgpzu_parser
(можно поменять на другое) и привязывает к порту 80 (благодаря этому приложение можно открыть в браузере). - Открыть браузер, набрать
localhost
в адресной строке и перейти.
- Приложение написано на Python, так как на этом языке проще работать с текстовыми и табличными данными. Docker-образ собран на базе образа Python 3.10 на Debian.
- Основные используемые библиотеки:
PyPDF2
,tabula-py
,pandas
,FastAPI
,Jinja2
,pymorphy2
. - У приложения есть веб-интерфейс и API.
- Документация API в запущенном веб-приложении доступна по адресу
localhost/docs
. - В веб-интерфейсе можно загрузить файл и распознать его, после чего скачать результат в
json
илиxlsx
. Ранее распознанные файлы сохраняются, и их можно скачать повторно. Можно удалить ранее загруженный файл. - Приложение можно запустить на сервере в локальной сети и использовать с нескольких компьютеров.