Este projeto consiste em uma aplicação de machine learning com webscraping para comparar a análise de sentimentos de comentários de produtos na Amazon e no Mercado Livre. O objetivo é utilizar processamento de linguagem natural (NLP) para calcular os escores de sentimento dos comentários e comparar as médias desses escores entre as duas plataformas.
A aplicação deste projeto pode trazer diversos benefícios para as empresas que atuam no comércio eletrônico. Ao analisar a percepção dos clientes e a qualidade dos produtos exibidos nas plataformas da Amazon e do Mercado Livre, as empresas podem obter os seguintes ganhos:
-
Melhoria da experiência do cliente: Ao entender como os clientes percebem a qualidade dos produtos, as empresas podem identificar pontos fortes e oportunidades de melhoria em seus catálogos. Isso permite tomar ações estratégicas para aprimorar a experiência do cliente e aumentar a satisfação.
-
Tomada de decisões embasada: Com base nos insights fornecidos pela análise de sentimentos dos comentários dos clientes, as empresas podem tomar decisões mais fundamentadas. Isso inclui decisões relacionadas a estratégias de produtos, gerenciamento de reputação online e atendimento ao cliente.
-
Identificação de tendências e padrões: Ao analisar um grande volume de comentários dos clientes, é possível identificar tendências e padrões relacionados à percepção de qualidade dos produtos. Essas informações podem ser utilizadas para antecipar demandas e tomar decisões estratégicas de forma proativa.
-
Acompanhamento da concorrência: Comparar a percepção de qualidade dos produtos entre diferentes plataformas, como Amazon e Mercado Livre, permite às empresas monitorar a posição de sua marca em relação à concorrência. Isso pode ajudar na identificação de diferenciais competitivos e na definição de estratégias de mercado.
Em suma, aplicar este projeto permite que as empresas tenham uma visão abrangente e atualizada sobre como os consumidores enxergam a qualidade dos produtos em plataformas de comércio eletrônico. Isso possibilita melhorias na experiência do cliente, tomadas de decisão mais embasadas e uma posição competitiva mais forte no mercado.
- Webscraping de avaliações de produtos listados em um txt.
- Leitura de arquivos CSV contendo os comentários de produtos da Amazon e do Mercado Livre.
- Cálculo dos escores de sentimento usando a biblioteca NLTK (Natural Language Toolkit).
- Comparação das médias dos escores de sentimento entre a Amazon e o Mercado Livre para um item selecionado.
- Identificação dos comentários com os escores mais baixos e mais altos para a Amazon e o Mercado Livre.
Certifique-se de ter as seguintes bibliotecas instaladas em seu ambiente de desenvolvimento:
- pandas
- numpy
- nltk
- googletrans
- tqdm
- requests
- bs4
- selenium
- webdriver (ChromeDriver)
-
Clone este repositório em seu ambiente de desenvolvimento local.
-
Certifique-se de ter os arquivos CSV contendo os comentários da Amazon (
reviews_amazon_english_nowarning_final.csv
) e do Mercado Livre (reviews_meli_english_nowarning_final.csv
). -
Execute o comando no terminal
python app_flask.py
para iniciar a aplicação. -
Na aplicação web, selecione um item da lista apresentada e observe os resultados na página que abrir.
Para execução no ambiente python, utilize o app.py
-
app_flask.py
: Contém o código principal da aplicação, incluindo a leitura dos arquivos CSV, cálculo dos escores de sentimento, filtragem de comentários e exibição dos resultados. -
translator.py
: Responsável pela tradução dos comentários do português para o inglês usando a biblioteca Google Translate. -
amazon_scraper.py
: Realiza o web scraping dos comentários dos produtos na Amazon usando a biblioteca BeautifulSoup e requests. -
meli_scraper.py
: Realiza o web scraping dos comentários dos produtos no Mercado Livre usando a biblioteca BeautifulSoup, Selenium e o webdriver do Chrome.
-
Certifique-se de ter as dependências necessárias instaladas em seu ambiente de desenvolvimento antes de executar o projeto.
-
Os arquivos CSV contendo os comentários da Amazon e do Mercado Livre devem ser fornecidos e estar no mesmo diretório do projeto.
-
Certifique-se de ter o ChromeDriver instalado e configurado corretamente para executar o web scraping na Amazon e no Mercado Livre.
-
O arquivo
missing_values.txt
contém a lista de produtos a serem pesquisados nos websites. Certifique-se de fornecer os produtos de interesse nesse arquivo. -
Os resultados serão exibidos no terminal após a execução do programa. Certifique-se de que a saída do terminal seja compatível com caracteres especiais para evitar problemas na exibição dos resultados.
O desempenho do web scraping pode variar de acordo com a conexão com a Internet e a velocidade de resposta dos websites.
-
O projeto atual é focado na comparação de comentários de produtos específicos entre a Amazon e o Mercado Livre. Não leva em consideração outros fatores que podem afetar a análise de sentimentos, como a reputação do vendedor, o número de vendas, etc.
-
A tradução dos comentários do português para o inglês é realizada automaticamente, mas pode haver imprecisões ou erros de tradução.
Se você deseja contribuir para este projeto, sinta-se à vontade para abrir um pull request. Será um prazer receber feedbacks e melhorias para a aplicação.
Para realizar o deploy do aplicativo em um servidor Linux, foram seguidos os seguintes passos:
-
Criou-se uma instância EC2 na AWS.
-
Conectou-se à instância EC2 utilizando o PuTTY.
-
Instalou-se os pacotes necessários no servidor utilizando o gerenciador de pacotes.
-
Transferiu-se os arquivos do projeto para o servidor utilizando o WinSCP.
-
Utilizou-se o pacote
screen
para manter o servidor rodando mesmo após a desconexão do SSH. -
O site ficou disponível na web através do acesso ao endereço IP público da instância EC2.
Esses passos permitiram a disponibilização do aplicativo web em um ambiente remoto para acesso público.
Este projeto apresentou uma análise de sentimentos de comentários de produtos na Amazon e no Mercado Livre, utilizando técnicas de machine learning, webscraping e processamento de linguagem natural. Apesar das limitações encontradas, como a tradução automática e a disponibilidade limitada dos dados, o projeto foi capaz de fornecer insights interessantes sobre a percepção de qualidade dos produtos em ambas as plataformas.
Com a aplicação do projeto em um ambiente de produção na AWS, foi possível disponibilizar o aplicativo web de forma acessível através da internet. Isso permitiu que os usuários pudessem comparar os resultados de forma fácil e conveniente.
Em suma, este projeto demonstrou o poder da análise de sentimentos e do webscraping na comparação de plataformas de comércio eletrônico. Com melhorias contínuas e expansão do escopo do projeto, é possível obter insights ainda mais valiosos sobre a percepção dos clientes em relação aos produtos oferecidos pela Amazon e pelo Mercado Livre.
Para mais detalhes sobre o projeto, você pode ler o artigo completo no Medium.
O projeto está hosteado neste link