Este projeto implementa um modelo de recomendação de animes com base nas preferências e histórico de visualização do usuário. A biblioteca Surprise, amplamente utilizada para sistemas de recomendação, é usada aqui, e diversos algoritmos de filtragem colaborativa são implementados para gerar recomendações personalizadas.
Este documento descreve a implementação e uso do modelo de recomendação de animes construído com a biblioteca Surprise. O modelo é projetado para sugerir animes com base nas preferências e histórico de visualização do usuário. O Surprise é uma biblioteca Python amplamente utilizada para sistemas de recomendação e tem uma variedade de algoritmos de filtragem colaborativa implementados para gerar recomendações personalizadas.
Para saber mais sobre o Surprise, acesse Surprise.
- Python
- Jupyter Notebook
- Biblioteca scikit-surprise
- Conjunto de dados de animes
ou - Google Colab.
Os dados de avaliações de animes são carregados a partir de um arquivo CSV, e os dados de labels dos animes também são carregados a partir de um arquivo CSV. Os conjuntos de dados utilizados são do Kaggle.
Uma análise exploratória dos dados é realizada, incluindo estatísticas descritivas das avaliações, visualização da distribuição das notas e informações sobre a quantidade de animes, usuários e amostras no conjunto de dados.
O dataset é preparado especificando o intervalo de valores esperados para as avaliações. Isso é importante para informar ao Surprise qual é o intervalo de classificação dos dados.
O modelo de recomendação é treinado com os dados de treinamento usando o algoritmo SVDpp. Também é possível ajustar os parâmetros do modelo para obter melhores resultados.
As previsões são feitas com o conjunto de teste e os resultados são exibidos.
O modelo é usado para encontrar os 10 melhores animes recomendados para um usuário específico com base em suas preferências.
Além das recomendações para usuários, o modelo também encontra animes semelhantes a um anime específico usando o algoritmo KNN.
O resultado do modelo é avaliado usando a métrica RMSE (Root Mean Square Error) para medir o erro médio das previsões em relação aos valores reais.