- Необходимо создать индекс в Amazon CloudSearch, файлы конфигурации находятся в директории
/cloudsearch
. - Так как CloudSearch не поддерживает настройки CORS, то ещё нужно создать API Gateway с
Access-Control-Allow-Origin: *
. - Установите пакеты, необходимые для работы textract, он используется для конвертации документов в текст.
- Установите зависимости Python:
pip install -r requirements.txt
Загрузка данных (при необходимости замените v150
в ссылке на последнюю версию):
python3 sources/mosgorsud/main.py
Обновление индекса (замените <id>
на реальное значение):
python3 sources/mosgorsud/export.py
find data/mosgorsud/export -name "*.json" -type f -exec aws cloudsearchdomain upload-documents --endpoint-url https://doc-court-cases-<id>.us-east-1.cloudsearch.amazonaws.com --content-type application/json --documents {} \;
rm data/mosgorsud/export/*.json
Форма для поиска обращается напрямую к индексу. В текущий момент она доступна по адресу https://court.putnik.tech/.