/twitter

Primary LanguageJupyter Notebook

La casa de Papel

Classificador Naive-Bayes para tweets

Projeto 1 de Ciência dos Dados.

Alunos:

  • Arthur Martins de Souza Barreto
  • Giselle Vieira de Melo

Os gênios do crime que dominaram as telas do mundo inteiro em La casa de Papel e que conquistaram várias premiações como o Emmy Internacional de melhor série dramática, além de se tornar uma das séries mais populares da IMDb possui uma boa aclamação crítica dado seu enredo sofisticado e dramas interpessoais, se tornando a série em língua não inglesa mais assistida de 2018.

A partir disso, com o lançamento da primeira parte da quinta (e última) temporada no dia 03 de Setembro de 2021, é de regular tendência pelo mundo inteiro comentários no twitter, tendo até celebridades comentando sobre a série nessa rede.

Dessa forma, por meio da categorização dos postagens dos usuários do twitter, esse projeto visa analisar os comentários a respeito da obra, como elogios e críticas diretamente relacionados à série, desconsiderando por exemplo, tweets de marcação ou sobre temas paralelos.

Para tanto, o Classificador Naive Bayes foi utilizado!

Bibliotecas utilizadas:

  1. emoji
  2. seaborn
  3. sklearn
  4. nltk
  5. pandas
  6. matplotlib.pyplot
  7. numpy
  8. os
  9. re
  10. functools
  11. operator

Principais bibliografias:

Naive Bayes and Text Classification Mais completo

A practical explanation of a Naive Bayes Classifier Mais simples

La Casa de Papel' vence Emmy Internacional de melhor série dramática

Bazinga! Caracterizando e Detectando Sarcasmo e Ironia no Twitter

Better Naive Bayes: 12 Tips To Get The Most From The Naive Bayes Algorithm

Melhorando a Performance do Algoritmo Naive Bayes para Regressão Através da Combinação de Atributos