O biblio-map é uma ferramenta programada para gerar mapeamentos visuais
de corpi bibliográficos, baseada em associações entre os nomes dos autores e
suas respectivas ocorrências dentro de cada texto, bem como as palavras-chave
que aparecem em torno de cada uma dessas associações. Os gráficos são gerados
utilizando a biblioteca pygraphviz.
É a função que faz as buscas das associações autor/texto/palavra-chave (em todas as
ordens possíveis de combinação), e guarda as referências em dicionários que serão
posteriormente usados para a obtenção e desenho dos dados nos gráficos.
Esta função formata as listas que servem de parâmetro para conta_e_associa()
(por meio de le_textos()
e palavras_chave
), e logo depois invoca esta última
função apropriadamente.
É a função mais prolixa, que obtém os dados retornados por cria_assocs()
e os
transforma em elementos para a geração dos gráficos (um por autor, até o momento).
Engloba tanto procedimentos de formatação dos dados quanto de formatação dos
elementos puramente gráficos. Esta função escreve uma imagem para cada nome de
autor, na mesma pasta onde se localiza o biblio-map.py
.
Basta rodar o comando python biblio-map.py
no diretório onde esteja o repositório
com a respectiva pasta corpus
. O programa obtém os nomes dos autores diretamente
de corpus
(os nomes estão em authors.txt
) e as palavras-chave de keywords.txt
,
arquivo este que, por enquanto, é digitado manualmente e pode ser extendido com novas
palavras conforme desejado. Uma imagem .gif
com o nome de cada autor será gerada,
com seu respectivo mapa de associações.
O biblio-map pode gerar desde mapas simples:
passando por gráficos de razoável complexidade:
até mapas com diversos nós e ligações:
- Ainda é necessário acelerar a execução do programa. Uma alternativa pode ser
encontrar um meio de evitar tantos for loops aninhados. - Futuramente, será conveniente formular um mecanismo automático para obtenção
de palavras-chave. - O programa deverá, em breve, oferecer a opção de gerar gráficos classificados
também por texto ou palavra-chave, além da atual opção padrão de classificar por
autor. - Um sistema de navegação/busca nas imagens geradas é um plano para médio-longo
prazo.