Reproduza a tabela 4.1 do livro texto calculando as estatísticas para sua coleção (5 pts).
Reproduza a tabela 4.2 do livro considerando as top-50 palavras mais frequentes de sua coleção (5 pts).
Plote curvas de rank-frequência (usando escala logarítmica) para palavras e bigramas na coleção que você coletou na atividade anterior. Quais os melhores valores do parâmetro c para cada curva (5 pts)?
Reproduza a tabela 4.5 do livro texto considerando a sua coleção (5 pts).