/Web_Scraping-Python

Web Scraping do RottenTomatoes utilizando Python

Primary LanguagePython

Por dentro do projeto

  • Bibliotecas importantes:
  • BeautifulSoup/Selenium -> Interação com o navegador
  • MatplotLib/Numpy -> Plotagem dos resultados,Vetorização da Imagem
  • WorldCloud -> Biblioteca responsável pela Nuvem de Palavras

Resumo

Nesse projeto eu tentei fazer uma analise qualitativa do filme joker tendo como base o projeto do canal programção dinâmica no youtube Utilizei o Selenium com o firefox para salvar a pagina web do Rotten Tomatoes,separei e encontrei os cometarios utilizando a biblioteca BeatifulSoup Por fim utlizei a biblioteca PIL com o numpy para abrir uma imagem e usar como máscara para a biblioteca da nuvem de palavras.

Resultado Após a remoção de preposições e limpeza palavras:

image

Problemas a resolver:

Por enquanto tive problemas com a parte da limpeza de palavras,para um futuro próximo eu espero deixar a nuvem apenas com a parte realmente qualitativa do filme

  • Obrigado :)