Sherlock

Sherlock Text Mining é uma ferramenta voltada para o auxilio à pesquisas científicas, devido a complexidade de manuseio de algumas ferramentas gratuitas disponíveis na comunidade, a motivação para a criação do Sherlock se deu pelo objetivo de criar uma ferramenta multiplataforma, com uma interface limpa e intuitiva e que pode ser utilizada por qualquer pessoa independente de conhecimentos técnicos na área de tecnologia da informação. A ferramenta é voltada para coleta de dados (tweets) da rede social Twitter. O projeto Sherlock é mantido pelo grupo MTPLNAM (Mineração de Textos, Processamento de Linguagem Natural e Aprendizado de Máquina) da Universidade Federal dos Vales do Jequitinhonha e Mucuri. Desenvolvida com a tecnologia Java 8 e integrada ao banco de dados Firebird 2.5, utiliza a API Twitter4j para conexão com a REST API do Twitter para busca dos tweets, O Sherlock é um software capaz de armazenar e disponibilizar as coletas realizadas em períodos distintos, oferecendo ao usuário a capacidade de recuperar e manipular as coletas gerando relatórios e estatísticas das informações obtidas, fornecendo também a funcionalidade de criação de um Corpus textual, dando ao usuário a possibilidade de efetuar agrupamento textual em softwares de clusterização.

O software ainda está em fase de desenvolvimento, algumas funcionalidades estão sendo codificadas, pois anteriormente não havia integração com banco de dados, a construção do Corpus era feita gravando arquivos diretamente no disco e não possuia a funcionalidade de realizar comparações estatísticas com os dados capturados.

Requisitos:

Java 8 ou superior

Firebird 2.2.5

Ramon5/Sherlock

Sherlock