/mw2ape

Gerador de arvore sintatica e de dependências - Wirth modificado para APE

Primary LanguageJava

mwsn2ape

Esta descrição contém informações parciais sobre este repositório.

mwsn2ape é um aplicativo de linha de comando escrito em Java que implementa um 'pipeline' de NLP para um subconjunto do português brasileiro culto.

  • Entradas: uma gramática na notação Wirth modificada, um dicionário e padrões de dependência.
  • Saídas: árvore sintática ('phrase structure') e árvore de dependências.
  • Resultados intermediários: autômato de pilha estruturado correspondente à gramática de entrada, transdutor sintático.

Esta ferramenta é disponibilizada conforme 'GNU Public License version 3.0' e utiliza ferramentas auxiliares baseadas nos sistemas wirth2ape e nfa2dfa escrito por Paulo Cereda.

Apache Maven e Java 8 são necessários para compilar o mwsn2ape a partir do código fonte. Execute:

$ mvn assembly:assembly

Sample bash script

#!/bin/bash
#jar="~/IdeaProjects/mw2apeNLP/out/artifacts/mw2apeNLP/mw2apeNLP.jar"
jar="~/IdeaProjects/mw2apeNLP/target/mw2spaNLP-1.0-jar-with-dependencies.jar"
dict="~/Documentos/TeseExperimentos/dict/LuftDict.yml"
dot="~/Documentos/TeseExperimentos/grammar/automaton/%s.dot"
yml="~/Documentos/TeseExperimentos/grammar/yml/%s.yml"
gram="~/Documentos/TeseExperimentos/grammar/luft_all.gram"

java -jar "$jar" -n -o "$dot" -y "$yml" -d "$dict" -t 2 -i "$filename" "$gram"