/RI-TP1

Trabalhos práticos da disciplina Recuperação de Informação em 2011.1 do DCC-UFMG. Um indexador de uma coleções de páginas HTML. Contém implementações dos modelos de recuperação de informação vetorial (Vector Space Model) e BM-25, algortimo PageRank e uso de indexação de anchor text. O indexador utiliza indexação em disco baseada e ordenação externa.

Primary LanguageC++

Stargazers

No one’s star this repository yet.