Identifique endereços, bairros e outras localizações brasileiras em um texto. 🏘
Não sabe o que é o Tomba?
Objetivo:
import tomba
tomba.get_locations(
"Contratação de empresa de engenharia para executar obras "
"de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)
Saída:
[
{"type": "zipcode", "start": 92, "end": 123},
{"type": "neighborhood", "start": 113, "end": 118}
]
Suportando atualmente:
Endereços
- Endereços
- Bairros
- CEPs
- Coordenadas
- Cidades
- Estados
Utilizamos o poetry para empacotamento e gerenciamento das dependências.
Para instalar as dependências, execute poetry install
.
Para configurar o spacy em português, execute:
poetry run python -m spacy download pt_core_news_sm
Para rodar os testes:
poetry run pytest
Para gerar um novo modelo:
poetry run python tomba/models.py