La casa de Papel

Classificador Naive-Bayes para tweets

Projeto 1 de Ciência dos Dados.

Alunos:

Arthur Martins de Souza Barreto
Giselle Vieira de Melo

Os gênios do crime que dominaram as telas do mundo inteiro em La casa de Papel e que conquistaram várias premiações como o Emmy Internacional de melhor série dramática, além de se tornar uma das séries mais populares da IMDb possui uma boa aclamação crítica dado seu enredo sofisticado e dramas interpessoais, se tornando a série em língua não inglesa mais assistida de 2018.

A partir disso, com o lançamento da primeira parte da quinta (e última) temporada no dia 03 de Setembro de 2021, é de regular tendência pelo mundo inteiro comentários no twitter, tendo até celebridades comentando sobre a série nessa rede.

Dessa forma, por meio da categorização dos postagens dos usuários do twitter, esse projeto visa analisar os comentários a respeito da obra, como elogios e críticas diretamente relacionados à série, desconsiderando por exemplo, tweets de marcação ou sobre temas paralelos.

Para tanto, o Classificador Naive Bayes foi utilizado!

Bibliotecas utilizadas:

emoji
seaborn
sklearn
nltk
pandas
matplotlib.pyplot
numpy
os
re
functools
operator

Principais bibliografias:

Naive Bayes and Text Classification Mais completo

A practical explanation of a Naive Bayes Classifier Mais simples

La Casa de Papel' vence Emmy Internacional de melhor série dramática

Bazinga! Caracterizando e Detectando Sarcasmo e Ironia no Twitter

Better Naive Bayes: 12 Tips To Get The Most From The Naive Bayes Algorithm

Melhorando a Performance do Algoritmo Naive Bayes para Regressão Através da Combinação de Atributos

Arthur-Barreto/twitter